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C 是 一 门 重要 的 编程 语言 ， 一 直 以 来 备 受 关注 。C 语言 的 核心 是 指针 ， 这 门 语言 的 
灵活 性 和 超 长 之 处 很 大 一 部 分 都 源 于 指针 。 指 针 提 供 了 动态 操控 内 存 的 机 制 ， 强 化 
了 对 数据 结构 的 支持 ， 且 实现 了 访问 硬件 的 功能 。 不 过 ， 指 针 的 这 种 能 力 和 灵活 性 
是 有 代价 的 ， 它 很 难 掌握 。 


本 书 的 不 同 之 处 

市 面 上 已 经 出 版 了 大 量 关 于 C 的 图 书 ， 这 些 书 一 般 会 讲 到 语言 的 方方面面 ， 但 是 对 
于 指针 的 讲解 却 翻来覆去 总 是 那 点 东西 ， 很 少 涉及 指针 基本 知识 以 外 的 内 容 。 这 些 
书 大 部 分 只 是 粗略 地 提 一 下 内 存 管理 ， 甚 实 内 存 管 理 技术 很 重要 ， 会 牵涉 栈 和 堆 。 
不 讨论 这 些 内 容 ， 读 者 就 只 能 粗浅 地 理解 指针 。 栈 和 堆 是 分 别 用 来 支持 函数 和 动态 
内 存 分 配 的 内 存 区 域 。 


指针 非常 复杂 ， 值 得 我 们 深入 讨论 。 本 书 专门 研究 指针 ， 叶 在 让 读者 对 指针 的 理解 
更 加 深入 。 这 种 理解 在 某 种 程度 上 需要 读者 会 使 用 程序 栈 和 堆 ， 且 会 在 相关 上 下 文 
背景 下 使 用 指针 。 人 们 对 不 同 领域 知识 的 理解 程度 不 同 ， 有 大 体 粗略 了 解 ， 也 有 深 
入 透彻 的 理解 。 要 想 对 C 语言 的 理解 达到 更 高 的 层次 ， 就 必须 有 坚实 的 指针 和 内 存 
管理 基础 。 


学 习 方 法 

编程 其 实 就 是 操控 数据 ， 数 据 一 般 位 于 内 存 中 。 因 此 如 果 能 更 好 地 理解 C 如 何 
管理 内 存 ， 就 能 对 程序 的 工作 原理 洞 若 观 火 ， 从 而 使 编程 能 力 更 上 一 层 楼 。 知 道 
malloc 是 从 堆 上 分 配 内 存 是 一 回 事 ， 理 解 内 存 分 配 意味 着 什么 则 是 另 一 回 事 。 如 
果 我 们 分 配 一 个 逻辑 长 度 是 45 字 市 的 结构 体 ， 可 能 会 惊讶 地 发 现实 际 上 分 配 的 空间 
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往往 大 于 45 字 市 ， 而 且 分 配 的 内 存 可 能 会 碎片 化 。 


调用 函数 过 程 中 系统 会 创建 一 个 栈 帧 并 将 其 推 到 程序 栈 上 。 理 解 栈 帧 和 程序 栈 就 可 
以 弄 清楚 传 值 和 传 址 的 概念 。 尽 管 栈 帧 和 指针 没有 直接 联系 ,但 是 理解 栈 帧 有 助 于 
理解 递归 的 工作 原理 。 


为 方便 理解 指针 和 内 存 管理 技术 ， 我 们 会 讲 到 不 同 的 内 存 模型 ， 有 简单 的 线性 内 存 
布局 ， 也 有 更 复杂 的 针对 某 个 特定 示例 说 明 程序 栈 和 扒 状 态 的 图 例 。 显 示 在 屏幕 上 
或 是 印刷 在 书 中 的 代码 只 是 动态 程序 的 一 种 静态 表示 ， 这 种 表示 的 抽象 本 质 是 理解 
程序 行为 最 大 的 绊脚石 。 内 存 模 型 对 清除 这 些 绊脚石 非常 有 用 。 


目标 读者 


C 语言 是 块 结构 的 语言 ， 其 过 程式 编程 方法 在 C++ 和 Java 等 很 多 现代 语言 中 也 被 
采用 。 这 些 语言 都 要 用 到 程序 栈 和 堆 ， 也 都 会 用 到 指针 ， 只 不 过 通常 用 引用 来 包装 。 
阅读 本 书 要 求 你 对 C 有 最 基本 的 了 解 。 如 果 你 正在 学 C， 那 么 本 书 能 为 你 提供 比 其 
他 书 更 全 面 的 指针 和 内 存 的 知识 ， 能 扩大 你 的 C 知识 面 ， 也 能 让 你 发 现 自己 在 C 上 
的 薄弱 环节 。 如 果 你 是 有 经 验 的 C 或 者 C++ 程序 员 ， 本 书 能 帮 你 填补 对 C 语言 理 
解 的 空白 ， 也 能 强化 你 对 这 两 门 语言 工作 原理 的 理解 ， 从 而 让 你 成 长 为 更 优秀 的 程 
序 员 。 如 果 你 是 C# 或 者 Java 开发 者 ， 本 书 能 让 你 更 好 地 理解 C， 也 能 让 你 更 加 透 
彻 地 认识 面向 对 象 语言 如 何 处 理 栈 和 堆 。 


本 书 结构 


本 书 按照 数组 、 结 构 体 、 国 数 等 传统 主题 组 织 。 不 过 ， 所 有 章节 关注 的 焦点 都 在 于 
指针 的 使 用 和 内 存 管理 。 比 如 说 ， 我 们 讲 到 了 如 何 给 函数 传递 指针 和 从 函数 返回 指 
针 ， 也 讲 到 了 指针 在 栈 帧 中 的 使 用 以 及 指针 如 何 引 用 堆 中 的 内 存 。 


。 第 1 章 ， 认 识 指针 
这 一 章 为 非 专业 人 士 和 对 指针 比较 陌生 的 读者 介绍 指针 的 基础 知识 ， 包 括 指针 
操作 符 和 如 何 声明 不 同类 型 的 指针 〈 比 如 常量 指针 、 国 数 指 针 )， 以 及 如 何 使 用 
NULL 及 相关 变 体 。 这 对 内 存 的 分 配 和 使 用 方式 有 很 大 的 影响 。 















































。 第 2 章 ，C 的 动态 内 存 管理 
主要 介绍 标准 的 内 存 分 配 函 数 和 回收 内 存 的 相关 技术 。 能 否 及 时 回收 内 存 对 大 部 
分 应 用 程序 来 说 都 至 关 重 要 ， 做 不 到 这 一 点 就 会 导致 内 存 泄漏 和 迷途 指针 。 我 们 
也 讲 到 了 垃圾 收集 和 异常 处 理 函 数 等 回收 技术 。 
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。 第 3 章 ， 指 针 和 函数 


国 数 是 组 成 应 用 程序 代码 的 基石 ， 不 过 给 函数 传递 数据 和 从 国 数 返回 数据 可 能 让 
开发 新 手 迷 糊 。 这 一 章 介绍 传递 数据 的 技术 ， 以 及 用 指针 返回 数据 时 的 常见 陷阱。 
另外 还 会 详细 讲解 函数 指针 ， 这 种 指针 为 应 用 程序 提供 了 另 一 层 控制 和 灵活 性 。 














。 第 4 章 ， 指 针 和 数组 


尽管 指针 表示 法 和 数组 表示 法 不 能 完全 互 换 ， 但 两 者 紧密 相关 。 这 一 章 介 绍 一 维 
和 多 维 数组 及 其 与 指针 的 配合 使 用 ， 还 特别 针对 不 同 的 内 存 模型 解释 如 何 传递 数 
组 ， 以 及 用 连续 或 是 非 连续 的 方式 动态 分 配 数组 时 的 一 些 常见 问题 。 








第 5 章 ， 指 针 和 字符 串 

字符 串 是 很 多 应 用 程序 的 重要 组 成 部 分 ， 这 一 章 介 绍 字符 串 的 基本 知识 ， 以 及 如 
何 用 指针 操控 字符 串 。 字 面 量 地 及 其 对 指针 的 影响 也 是 很 多 人 忽视 的 一 个 C 特 
性 。 这 一 章 会 用 丰富 的 图 例 来 解释 和 说 明 这 个 主题 。 








。 第 6 章 ， 指 针 和 结构 体 


结构 体 提 供 了 一 种 排序 和 操控 数据 的 有 用 方式 ， 指 针 则 通过 在 结构 体 的 创建 方式 
上 提供 更 多 的 灵活 性 进一步 强化 了 结构 体 的 用 途 。 这 一 章 介绍 结构 体 的 基本 知识 
及 其 与 内 存 分 配 和 指针 的 关系 ， 接 着 举例 说 明 如 何在 几 种 数据 结构 中 使 用 结构 体 。 
第 7 章 ， 安 全 问题 和 指针 误 用 

指针 很 强大 ， 但 也 可 能 造成 很 多 安全 问题 。 这 一 章 研究 缓冲 区 溢出 
及 相关 的 指针 问题 ， 也 会 讲 到 避免 这 类 问题 的 技术 。 
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的 基本 问题 以 


。 第 8 章 ， 其 他 重要 内 容 








最 后 一 章 介绍 一 些 比较 零散 但 重要 的 指针 技术 和 问题 。 尽 管 C 不 是 面向 对 象 语 
， 但 是 很 多 面向 对 象 的 编程 思想 可 以 融入 C 程序 ， 包 括 多 态 。 还 会 讲 到 在 多 线 
程 环境 中 使 用 指针 的 要 点 ， 以 及 restrict 关键 字 的 意义 和 用 法 。 


mk 


小 结 
本 书 旨 在 为 读者 提供 比 其 他 相关 图 





多 更 深入 的 关于 指针 用 法 的 知识 ， 展 示 从 指针 的 


核心 用 法 到 罕见 用 法 的 例子 ， 同 时 也 指出 常见 的 指针 问题 。 


排版 约定 


本 书 使 用 的 排版 约定 如 下 。 
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el 


Dl 


Ee eal 中 使 用 的 变 生 、 本 数 名 、 命 令 行 代码 、 数 





这 个 图 标 表示 提示 、 建 议 或 是 一 般 注 意 事项 。 








这 个 图 标 表 示警 告 。 











使 用 代码 


本 书 就 是 要 帮 读 者 解决 实际 问题 的 。 也 许 你 需要 在 自己 的 程序 或 文档 中 用 到 本 书 中 
的 代码 。 除 非 大 段 大 段 地 使 用 ， 否 则 不 必 与 我 们 联系 取得 授权 。 因 此 ， 用 本 书 中 的 
几 段 代码 写成 一 个 程序 不 用 向 我 们 申请 许可 。 但 是 销售 或 者 分 发 O'Reilly 图 书 随 附 
的 代码 光盘 则 必须 事先 获得 授权 。 引 用 书 中 的 代码 来 回答 问题 也 无 需 我 们 授权 。 将 
大 段 的 示例 代码 整合 到 你 自己 的 产品 文档 中 则 必须 经 过 许可 。 


使 用 我 们 的 代码 时 ， 和 希望 你 能 标明 它 的 出 处 。 出 处 一 般 要 包含 书 名 、 作 者 、 出 版 商 
和 书号 ， 例如: Understanding and Using C Pointers (O’Reilly). Copyright 2013 Richard 
Reese, Ph.D. 978-1-449-34418-4。 




















如 果 还 有 其 他 使 用 代码 的 情形 需要 与 我 们 沟通 ， 可 以 随时 与 我 们 联系 : permissions@ 


oreilly.com。 








Safari2 Books Online 


Safari Books Online (www.safaribooksonline.com) 是 应 


Safa rl 需 而 变 的 数字 图 书馆 。 它 同时 以 图 书 和 视频 的 形式 出 版 


Books Online 世界 顶级 技术 和 商务 作家 的 专业 作品 。 


Safari Books Online 是 技术 专家 、 软 件 开发 人 员 、Web 设计 师 、 商 务 人 士 和 创意 人 
士 开 展 调研 、 解 决 问 题 、 学 习 和 认证 培训 的 第 一 手 资料 。 
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对 于 组 织 团 体 、 政 府 机 构 和 个 人 ，Safari Books Online 提供 各 种 产品 组 合 和 灵活 
的 定价 策略 。 用 户 可 通过 一 个 功能 完备 的 数据 库 检 索 系 统 访问 OReilly Media、 


Prentice Hall Professional、Addison-Wesley Professional、 Microsoft Press、Sams、 





Que Peachpit Press、 Focal Press、Cisco Press、 John Wiley & Sons、 Syngress、 
Morgan Kaufmann、 IBM Redbooks、 Packt、 Adobe Press、 FT Press、 Apress.、 
Manning、New Riders、McGraw-Hill、Jones & Bartlett、Course Technology 以 及 其 他 
几 王 家 出 版 社 的 上 千 种 图 书 、 培 训 视频 和 正式 出 版 之 前 的 书稿 。 要 了 解 Safari Books 
Online 的 更 多 信息 ， 我 们 网 上 见 。 
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表 、 示 例 代码 以 及 其 他 信息 。 本 书 的 网 站 地 址 是 : 
http://oreil.ly/Understand_Use_CPointers 
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第 1 章 


认识 指针 








C 程序 员 新 手 和 老手 的 一 大 差别 就 在 于 是 否 对 指针 有 深刻 理解 ， 能 否 高 效 利用 指针 。 
指针 在 C 语言 中 随处 可 见 ， 也 提供 了 极 大 的 灵活 性 。 指 针 为 动态 内 存 分配 提 供 了 重 
要 支持 ， 与 数组 表示 法 紧密 相关 ， 指 向 函数 的 指针 也 为 程序 中 的 流 控制 提供 了 更 多 
的 选择 。 


一 直 以 来 ， 指 针 都 是 学 习 C 语言 的 最 大 障碍 。 指 针 的 基本 概念 很 简单 ， 就 是 一 个 存 
放 内 存 地 址 的 变量 。 然 而 ， 妆 我 们 开始 应 用 指针 操作 符 并 试图 看 慌 那 些 令 人 眼花 练 
乱 的 符号 时 ， 指 针 就 开始 变 得 复杂 了 。 但 情况 并 非 总 是 如 此 ， 如 果 我 们 从 简单 的 知 
识 入 手 ， 打 好 扎实 的 基础 ， 那 么 掌握 指针 的 高 级 应 用 并 不 难 。 


理解 指针 的 关键 在 于 理解 C 程序 如 何 管理 内 存 。 归 根 结 底 ， 指 针 包 含 的 就 是 内 存 地 
址 。 不 理解 组 织 和 管理 内 存 的 方式 ， 就 很 难 理解 指针 的 工作 方式 。 为 此 ， 只 要 对 解 
释 指针 的 原理 有 帮助 ， 我 们 就 会 说 明 内 存 的 组 织 方 式 。 牢 牢 擎 握 了 内 存 及 其 组 织 方 
式 ， 理 解 指针 就 会 容易 很 多 。 


本 章 简 要 介绍 指针 、 指 针 操 作 符 以 及 指针 如 何 与 内 存 相 互 作用 。1.1 市 研究 如 何 声 明 
指针 、 基 本 的 指针 操作 符 和 null 的 概念 。C 支持 好 儿 种 不 同类 型 的 null， 所 以 仔 
细 研 究 null 会 对 我 们 有 所 启发 。 


1.2 节 将 细致 地 介绍 几 种 不 同 的 内 存 模 型 。 毫 无 疑问 ， 我 们 在 使 用 C 的 过 程 中 肯定 
会 遇 到 各 种 内 存 模型 。 特 定编 译 器 和 操作 系统 下 的 内 存 模型 会 影响 指针 的 使 用 方式 。 
我 们 也 将 仔细 研究 跟 指 针 和 内 存 模 型 有 关 的 儿 种 预定 义 类 型 。 














1.3 市 会 深入 探讨 指针 操作 符 ， 包 括 指针 的 算术 运算 和 比较 。1.4 市 探究 常量 和 指 
针 。 众 多 的 声明 组 合 提供 了 有 趣 通 常 也 很 有 用 的 方法 。 

无 论 你 是 C 程序 员 新 手 还 是 老手 ， 本 书 都 能 帮助 你 深入 理解 指针 ， 填 补 你 知识 结构 
中 的 空白 。 老 手 可 以 挑选 感 兴趣 的 主题 ， 新 手 还 是 按部就班 为 好 。 


已 

1.1 指针 和 内 存 

C 程序 在 编译 后 ， 会 以 三 种 形式 使 用 内 存 。 

。 静态 /全 局 内 存 
静态 声明 的 变量 分 配 在 这 里 ， 全 局 变量 也 使 用 这 部 分 内 存 。 这 些 变量 在 程序 开始 
运行 时 分 配 ， 直 到 程序 终止 才 消 失 。 所 有 函数 都 能 访问 全 局 变量 ， 静 态 变量 的 作 
用 域 则 局 限 在 定义 它们 的 函数 内 部 。 

。 自动 内 存 
这 些 变量 在 函数 内 部 声明 ， 并 且 在 函数 被 调用 时 才 创 建 。 它 们 的 作用 域 局 限于 抑 
数 内 部 ， 而 且 生 命 周 期 限制 在 函数 的 执行 时 间 内 。 

。 动态 内 存 
内 存 分 配 在 堆 上 ， 可 以 根据 需要 释放 ， 而 且 直到 释放 才 消 失 。 指 针 引 用 分 配 的 内 
存 ， 作 用 域 局 限于 引用 内 存 的 指针 ， 这 是 第 2 章 的 重点 。 

表 1-1 总 结 了 这 些 内 存 区 域 中 用 到 的 变量 的 作用 域 和 生命 周期 。 


表 1-1: 不 同 内 存 中 变量 的 作用 域 和 生命 周期 
















































































作 用 域 生命 周期 
全 局 内 存 整个 文件 应 用 程序 的 生命 周期 
静态 内 存 声明 它 的 函数 内 部 应 用 程序 的 生命 周期 
自动 内 存 (局 部 内 存 ) 声明 它 的 函数 内 部 限制 在 函数 执行 时 间 内 
动态 内 存 1 引用 该 内 存 的 指针 决定 直到 内 存 释 放 
































理解 这 些 内 存 类 型 可 以 更 好 地 理解 指针 。 大 部 分 指针 用 来 操作 内 存 中 的 数据 ， 因 此 
存 的 分 区 和 组 织 方式 有 助 于 我 们 弄 清 楚 指 针 如 何 操 作 内 存 。 


指针 变量 包含 内 存 中 别 的 变量 、 对 象 或 函数 的 地 址 。 对 象 就 是 内 存 分 配 函 数 ( 比 如 
malloc) 分 配 的 内 存 。 指 针 通 常 根 据 所 指 的 数据 类 型 来 声明 。 对 象 可 以 是 任何 C 数 
据 类 型 ， 如 整数 、 字 符 、 字 符 串 或 结构 体 。 然 而 ， 指 针 本 身 并 没有 包含 所 引用 数据 
的 类 型 信息 ， 指 针 只 包含 地 址 。 
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1.1.1 为 什么 要 精通 指针 

指针 有 几 种 用 途 ， 包 括 : 

。 写 出 快速 高 效 的 代码 ， 

， 为 解决 很 多 类 问题 提供 方便 的 途径 ， 

。 支持 动态 内 存 分 配 ， 

。 使 表达 式 变 得 紧凑 和 简洁， 

。 提供 用 指针 传递 数据 结构 的 能 力 而 不 会 带 来 庞大 的 开销 ， 

。 保护 作为 参数 传递 给 函数 的 数据 。 

用 指针 可 以 写 出 快速 高 效 的 代码 是 因为 指针 更 接近 硬件 。 也 就 是 说 ， 编 译 器 可 以 更 
容易 地 把 操作 翻译 成 机 器 码 。 指 针 附带 的 开销 一 般 不 像 别 的 操作 符 那 样 大 。 

很 多 数据 结构 用 指针 更 容易 实现 ， 比 如 链表 可 以 用 数组 实现 ， 也 可 以 用 指针 实现 。 
然而 ， 指 针 更 容易 使 用 ， 也 能 直接 映射 到 下 一 个 或 上 一 个 链接 。 用 数组 实现 需要 用 
到 数组 下 标 ， 不 直观 ， 也 没有 指针 灵活 。 

图 1-1 比较 形象 地 展示 了 用 数组 和 指针 实现 员工 链表 时 的 情形 。 图 中 左边 用 了 数组 ， 
head 变量 表明 链表 的 第 一 个 元 素 在 数组 下 标 10 的 位 置 ， 每 一 个 数组 元 素 都 包含 表 
示 员 工 的 数据 结构 。 结 构 的 next 字段 存放 下 一 个 员工 在 数组 中 的 下 标 。 灰 底 的 元 
素 表 示 未 使 用 。 























使 用 数组 使 用 指针 
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图 1-1: 链表 的 数组 形式 和 指针 形式 
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右边 显示 了 用 指针 实现 的 等 价 形式 。head 变量 存放 指向 第 一 个 员工 节点 的 指针 。 每 
个 节点 存放 员工 数据 和 指向 链表 中 下 一 个 节点 的 指针 。 


指针 形式 不 仅 更 清晰 ， 也 更 灵活 。 通 常 创建 数组 时 需要 知道 数组 的 长 度 ， 这 样 就 会 
限制 链表 所 能 容纳 的 元 素数 量 。 使 用 指针 没有 这 个 限制 ， 因 为 新 节点 可 以 根据 需要 
动态 分 配 。 


C 的 动态 内 存 分 配 实际 上 就 是 通过 使 用 指针 实现 的 。malloc 和 free 国 数 分 别 用 
来 分 配 和 释放 动态 内 存 。 动 态 内 存 分 配 可 以 实现 变 长 数组 和 数据 结构 (如 链表 和 队 
列 )。 不 过 ， 新 的 C11 标准 也 支持 变 长 数组 了 。 


紧凑 的 表达 式 有 很 强 的 表达 能 力 ， 但 也 比较 蜀 誉 ， 因 为 很 多 程序 员 并 不 能 完全 理解 
指针 表示 法 。 紧 次 的 表达 式 应 该 用 来 满足 特定 的 需要 ， 而 不 是 为 隐 座 而 上 座 。 比 
如 说 ， 下 面 的 代码 用 了 两 个 不 同 的 printf 函数 调用 来 打印 names 的 第 二 个 元 素 的 
第 三 个 字符 。 如 果 对 指针 的 这 种 用 法 感到 困惑 ， 不 用 担心 ， 我 们 会 在 1.1.6 节 中 详 
细 介 绍 解 引 (dereference) 的 工作 原理 。 尽 管 两 种 方式 都 会 显示 字母 n， 但 是 数组 
表示 法 更 简单 。 
































char *names[] = {"Miller","Jones","Anderson"}; 
printf("%c\n",*(*(names+1)+2)); 
printf("%c\n",names[1] [2]); 


指针 是 创建 和 加 强 应 用 的 强大 工具 ， 不 利之 处 则 是 使 用 指针 过 程 中 可 能 会 发 生 很 多 
问题 ， 比 如 : 


。 访问 数组 和 其 他 数据 结构 时 越界 ， 
。 自动 变量 消失 后 被 引用 ， 

。 堆 上 分 配 的 内 存 释放 后 被 引用 ，; 
。 内 存 分 配 之 前 解 引 指针 。 


我 们 会 在 第 7 章 深 入 研究 这 几 类 问题 。 

















指针 的 语法 和 语义 在 C 规 范 (http://www.open-std.org/jtcl/sc22/WG14/www/docs/ 
n1256.pdf) 中 讲 得 很 清楚 了 ， 但 还 是 有 一 些 情况 下 规范 没有 明确 定义 指针 的 行为 。 
这 类 情况 下 ， 指 针 的 行为 定义 为 如 下 之 一 。 


。 实现 定义 
有 具体 的 实现 ， 并 且 有 文档 描述 。 实 现 定义 行为 的 一 个 例子 就 是 当 整 数 做 右 移 操 
作 时 如 何 补 充 符号 位 。 








。 未 确定 
有 某 种 实现 ， 但 是 没有 文档 描述 。 未 确定 行为 的 一 个 例子 是 当 malloc 函数 的 
参数 为 0 时 所 分 配 的 内 存 大 小 。 在 CERT Secure Coding Appendix DD 有 一 个 
未 确定 行为 的 列表 (参见 https:/www.securecoding.cert.org/confluence/display/ 
seccode/DD.+Unspecified+Behavior)。 


没有 规定 ， 任 何事 情 都 有 可 能 发 生 。 这 种 行为 的 一 个 例子 是 被 free 函数 释放 的 指 
针 的 值 。CERT Secure Coding Appendix CC 有 一 个 未 定义 行为 的 列表 (参见 https:// 


www.securecoding. cert.org/confluence/display/seccode/CC.+Undefined+Behavior) 。 





有 时 候 还 会 有 语言 环境 相关 的 行为 ， 这 些 行为 一 般 由 编译 器 三 商 的 文档 说 明 。 提 供 
语言 环境 相关 的 行为 能 够 为 编译 器 作者 生成 更 高 效 的 代码 提供 更 多 空间 。 


1.1.2 声明 指针 
通过 在 数据 类 型 后 面 跟 星 号 ， 再 加 上 指针 变量 的 名 字 可 以 声明 指针 。 下 面 的 例子 声 
明了 一 个 整数 和 一 个 整数 指针 ， 





int num; 
int *pi; 


星 号 两 边 的 空白 符 无 关 紧 要 ， 下 面 的 声明 都 是 等 价 的 : 


int* pi; 
int * pi; 
int *pi; 
int*pi; 
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符 的 使 用 是 个 人 喜好 。 








星 号 将 变量 声明 为 指针 。 这 是 一 个 重 载 过 的 符号 ， 因 为 它 也 用 在 乘法 和 解 引 指针 上 。 


对 于 以 上 声明 ， 图 1-2 说 明了 典型 的 内 存 分 配 是 什么 样 的 。 三 个 方 框 表示 三 个 内 存 
单元 ， 每 个 方 框 左边 的 数字 是 地 址 ， 地 址 旁边 的 名 字 是 持 有 这 个 地 址 的 变量 ， 这 里 
的 地 址 100 只 是 为 了 说 明 原 理 。 就 这 个 问题 来 说 ， 指 针 或 者 其 他 变量 的 实际 地 址 通 
党 是 未 知 的 ， 而 且 在 大 部 分 的 应 用 程序 中 ， 这 个 值 也 没什么 用 。 三 个 点 表示 未 初始 
化 的 内 存 。 
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num100 | .. | 
pi104| .… | 
108| ... | 
图 1-2: 内 存 图 解 


指向 未 初始 化 的 内 存 的 指针 可 能 会 产生 问题 。 如 果 将 这 种 指针 解 引 ， 指 针 的 内 容 可 
能 并 不 是 一 个 合法 的 地 址 ， 就 算是 合法 地 址 ， 那 个 地 址 也 可 能 没有 包含 合法 的 数据 。 
程序 没有 权限 访问 不 合法 地 址 ， 否 则 在 大 部 分 平台 上 会 造成 程序 终止 ， 这 是 很 严重 
的 ， 会 造成 一 系列 问题 ， 第 7 章 将 讨论 这 些 问 题 。 

变量 num 和 pi 分别 位 于 地 址 100 和 104。 假 设 这 两 个 变量 都 占据 4 字 节 空间 ， 就 
像 1.2 节 中 所 说 ， 实 际 的 长 度 取决 于 系统 配置 。 除 非特 别 指明 ， 我 们 所 有 的 例子 都 
使 用 4 字 节 长 的 整数 。 














本 书 用 100 这 样 的 地 址 来 解释 指针 如 何 工作 ， 这 样 会 简化 例子 。 当 你 运 
心 示例 代码 时 会 得 到 不 同 的 地 址 ， 而 且 这 些 地 址 甚至 在 同一 个 程序 运行 几 
尾 ， 的 时 候 都 可 能 变化 。 











记 住 这 几 点 : 


。 pi 的 内 容 最 终 应 该 赋值 为 一 个 整数 变量 的 地 址 ， 

。 这 些 变量 没有 被 初始 化 ， 所 以 包含 的 是 垃圾 数据 ， 

。 指针 的 实现 中 没有 内 部 信息 表明 自己 指向 的 是 什么 类 型 的 数据 或 者 内 容 是 否 合法 ，; 
。 不 过 ， 指 针 有 类 型 ， 而 且 如 果 没 有 正确 使 用 ， 编 译 器 会 频繁 抱怨 。 





说 到 垃圾 ， 我 们 是 指 分 配 的 内 存 中 可 能 包含 任何 数据 。 当 内 存 刚 分 配 时 不 

心 。 会 被 清理 ， 之 前 的 内 容 可 能 是 任何 东西 。 如 采 之 前 的 内 容 是 一 个 浮 点 数 ， 

外 ， 那 把 它 当成 一 个 整数 就 没什么 用 。 就 算 确 实 包 含 了 整数 ， 也 不 大 可 能 是 正 
确 的 整数 。 所 以 我 们 说 内 容 是 垃圾 。 














尽管 不 经 过 初始 化 就 可 以 使 用 指针 ， 但 只 有 初始 化 后 ， 指 针 才 会 正常 工作 。 


1.1.3 如 何 阅读 声明 
现在 介绍 一 种 阅读 指针 声明 的 方法 ， 这 个 方法 会 让 指针 更 容易 理解 ， 那 就 是 : 倒 过 
来 读 。 尽 管 我 们 还 没 讲 到 指向 常量 的 指针 ， 但 可 以 先 看 看 它 的 声明 : 





， 了 
const int *pc 


倒 过 来 读 可 以 让 我 们 一 点 点 理解 这 个 声明 ( 见 图 1-3)。 
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1. pci 是 一 个 变量 Const int *pci; 
2. pci 是 一 个 指针 变量 const int *pci; 
3. pci 是 一 个 指向 整数 的 指针 变量 const int *pci; 


4. pci 是 一 个 指向 整数 常量 的 指针 变量 const int *pci; 














图 1-3: 倒 过 来 的 声明 


很 多 程序 员 都 发 现 倒 过 来 读 声 明 就 没 那 么 复杂 了 。 





as 遇 到 复杂 的 指针 表达 式 时 ， 画 一 张 图 ， 我 们 在 很 多 例子 中 就 是 这 样 做 的 。 
~ A 





1.1.4 ”地 址 操作 符 


地 址 操作 符 & 会 返回 操作 数 的 地 址 。 我 们 可 以 用 这 个 操作 符 来 初始 化 pi 指针 ， 如 


下 所 示 : 
num = 0; 
pi = Snum， 


num 变量 设置 为 0， 而 pi 设置 为 指向 num 的 地 址 ， 如 图 1-4 所 示 。 














num100| 0 | 
pi104 | 100 | 
108 | … | 
图 1-4: 内 存 赋 值 


可 以 在 声明 变量 pi 的 同时 把 它 初始 化 为 num 的 地 址 ， 如 下 所 示 : 





int num; 
int *pi = &num; 


有 了 以 上 声明 ， 下 面 的 语句 在 大 部 分 编译 器 中 都 会 报 语法 错误 : 


num = 0; 
pi = num; 


省 误 看 起 来 可 能 是 这 样 的 : 


error: invalid conversion from 'int' to 'int*' 


pi 变量 的 类 型 是 整数 指针 ， 而 num 的 类 型 是 整数 。 这 个 错误 消息 是 说 整数 不 能 转换 
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为 指向 整数 类 型 的 指针 。 


过 








把 整数 赋值 给 指针 一 般 都 会 导致 警告 或 错误 。 


指针 和 整数 不 一 样 。 在 大 部 分 机 器 上 ， 可 能 两 者 都 是 存储 为 相同 字 节 数 的 数字 ， 但 
它们 不 一 样 。 不 过 ， 也 可 以 把 整数 转换 为 指向 整数 的 指针 ; 

pi = (int *)num; 
这 样 不 会 产生 语法 错误 。 不 过 运行 起 来 后 ， 程 序 可 能 会 因为 试图 解 引 地 址 0 处 的 值 
而 非 正常 退出 。 在 大 部 分 操作 系统 中 ， 在 程序 中 使 用 地 址 0 是 不 合法 的 ， 我 们 会 在 
1.1.8 市 中 详细 讨论 这 个 问题 。 














池 纪 
Se 尽快 初始 化 指针 是 一 个 好 习惯 ， 如 下 所 示 : 
4 
AS int num; 
0 int *pi; 





pi = &num; 


1.1.5 打印 指针 的 值 
我 们 实际 使 用 的 变量 几乎 不 可 能 有 100 或 104 这 样 的 地 址 。 不 过 ， 变 量 的 地 址 可 以 
通过 打印 来 确定 ， 如 下 所 示 : 

















int num = 0; 
int *pi = &num; 


printf("Address of num: %d Value: %d\n",é&num, num); 
printf("Address of pi: %d Value: %d\n",&pi, pi); 


运行 后 ， 会 得 到 下 面 的 输出 。 在 这 个 例子 中 我 们 用 了 真实 的 地 址 ， 你 的 地 址 可 能 会 
不 一 样 : 








Address of num: 4520836 Value: 0 
Address of pi: 4520824 Value: 4520836 


printf 函数 还 有 其 他 儿 种 格式 说 明 符 在 打印 指针 的 值 时 比较 有 用 ， 如 表 1-2 所 示 。 
表 1-2: 格式 说 明 符 








格式 说 明 符 含 义 

%x 将 值 显示 为 十 六 进 制 数 

%o 将 值 显示 为 八进制 数 

%p 将 值 显示 为 实现 专用 的 格式 ， 通 常 是 十 六 进 制 数 

















这 些 说 明 符 的 用 法 如 下 : 


printf("Address of pi: %d Value: %d\n",&pi, pi); 
printf("Address of pi: %x Value: %x\n",&pi, pi); 
printf("Address of pi: %o Value: %o\n",&pi, pi); 
printf("Address of pi: %p Value: %p\n",&pi, pi); 


这 样 就 会 显示 pi 的 地 址 和 内 容 ， 如 下 所 示 。 在 这 个 例子 中 ，pi 持 有 num 的 地 址 : 


Address of pi: 4520824 Value: 4520836 
Address of pi: 44fb78 Value: 44fb84 
Address of pi: 21175570 Value: 21175604 
Address of pi: 0044FB78 Value: 0044FB84 














%p 和 %x 的 不 同 之 处 在 于 : %p 一 般 会 把 数字 显示 为 十 六 进 制 大 写 。 如 果 没 有 特别 说 
明 ， 我 们 用 %p a 叶 。 


在 不 同 的 平台 上 用 一 致 的 方式 显示 指针 的 值 比较 困难 。 一 种 方法 是 把 指针 转换 为 
void 指针 ， 然 后 用 %p 格式 说 明 符 来 显示 ， 如 下 : 


printf("Value of pi: %p\n", (void*)pi); 


void 指针 会 在 1.1.8 节 的 “void 指针 ”中 解释 。 为 了 保证 示例 简单 ， 我 们 会 用 %p 
说 明 符 ， 而 不 把 地 址 转换 为 void 指针 。 


虚拟 内 存 和 指针 


让 打印 地 址 变 得 更 为 复杂 的 是 ， 在 虚拟 操作 系统 上 显示 的 指针 地 址 一 般 不 是 真实 的 
物理 内 存 地 址 。 虚 拟 操作 系统 允许 程序 分 布 在 机 器 的 物理 地 址 空间 上 。 应 用 程序 分 
为 页 (或 帧 )， 这 些 页 表示 内 存 中 的 区 域 。 应 用 程序 的 页 被 分 配 在 不 同 的 (可 能 是 不 
相 邻 的 ) 内 存 区 域 上 ， 而 且 可 能 不 是 同时 处 于 内 存 中 。 i 统 需要 占用 被 某 
一 页 占据 的 内 存 ， 可 以 将 这 些 内 存 交 换 到 二 级 存储 器 中 ， 待 将 来 需要 时 再 装载 进 内 
存 中 (内存 地 址 一 般 都 会 与 之 前 的 不 同 )。 这 种 外 1 统管 理 内 存 提 供 了 
相当 大 的 灵活 性 。 

每 个 程序 都 假定 自己 能 够 访问 机 器 的 整个 物理 内 存 空间 ， 实 际 上 却 不 是 。 程 序 使 用 
的 地 址 是 虚拟 地 址 。 操 作 系统 会 在 需要 时 把 虚拟 地 址 映射 为 物理 内 存 地 址 。 


这 意味 着 页 中 的 代码 和 数据 在 程序 运行 时 可 能 位 于 不 同 的 物理 位 置 。 应 用 程序 的 虚 
拟 地 址 不 会 变 ， 就 是 我 们 在 查看 指针 内 容 时 看 到 的 地 址 。 操 作 系统 会 帮 有 我 们 将 虚拟 
地 址 映射 为 真实 地 址 。 


操作 系统 处 理 一 切 事 务 ， 程 序 员 无 法 控制 也 不 需要 关心 。 理 解 这 些 问 题 就 能 解释 在 
虚拟 操作 系统 中 运行 的 程序 所 返回 的 地 址 。 
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1.1.6 用 间接 引用 操作 符 解 引 指针 
间接 引用 操作 符 (*) 返回 指针 变量 指向 的 值 ， 一 般 称 为 解 引 指针 。 下 面 的 例子 声 
明和 初始 化 了 num 和 pi: 


int num = 5; 
int *pi = &num; 


然后 下 面 的 语句 就 用 间接 引用 操作 符 来 显示 5， 也 就 是 num 的 值 : 
printf("%p\n",*pi); // 显示 5 


我 们 也 可 以 把 解 引 操作 符 的 结果 用 做 左 值 。 术 话 “ 左 值 ”是 指 赋值 操作 符 左边 的 操 
作 数 ， 所 有 的 左 值 都 必须 可 以 修改 ， 因 为 它们 会 被 赋值 。 


下 面 的 代码 把 200 赋 给 pi 指向 的 整数 。 因 为 它 指向 num 变量 ，200 会 被 赋值 给 
num。 图 1-5 说 明了 这 个 操作 如 何 影响 内 存 。 


num 100 
pi104 
108| ... | 








*pi = 200; 
printf("%d\n"，num); // 显 示 200 














图 1-5: 利用 解 引 操作 符 给 内 存 赋值 


1.1.7 ”指向 函数 的 指针 
指针 可 以 声明 为 指向 函数 ， 声 明 的 写法 有 点 难 记 。 下 面 的 代码 说 明 如 何 声明 一 个 指 
向 函数 的 指针 。 函 数 没有 参数 也 没有 返回 值 。 指 针 的 名 字 是 foo: 




















void (*fo0)(); 


指向 函数 的 指针 有 很 多 值得 讨论 的 地 方 ， 详 见 第 3 章 。 


1.1.8 ” null 的 概念 
null 很 有 趣 ， 但 有 时 候 会 被 误解 。 之 所 以 会 造成 迷惑 ， 是 因为 我 们 会 遇 到 几 种 类 似 
但 又 不 一 样 的 概念 ， 包 括 : 





。 null 概念 ; 
。 null 指针 常量 ， 
。 NULL 安 ; 
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。 ASCII 字符 NUL; 
。 null 字符 串 ; 
。 null 语句 。 


NULL 被 赋值 给 指针 就 意味 着 指针 不 指向 任何 东西 。null 概念 是 指 指针 包含 了 一 个 
特殊 的 值 ， 和 别 的 指针 不 一 样 ， 它 没有 指向 任何 内 存 区 域 。 两 个 null 指针 总 是 相 
等 的 。 尽 管 不 常见 ， 但 每 一 种 指针 类 型 (如 字符 指针 和 整数 指针 ) 都 可 以 有 对 应 的 
null 指针 类 型 。 
null 概念 是 通过 null 指针 常量 来 支持 的 一 种 抽象 。 这 个 常量 可 能 是 也 可 能 不 是 常 
量 0，C 程序 员 不 需要 关心 实际 的 内 部 表示 。 
NULL 宏 是 强制 类 型 转换 为 void 指针 的 整数 常量 0。 在 很 多 库 中 定义 如 下 : 

#define NULL ((void *)0) 
这 就 是 我 们 通常 理解 为 nuLL 指针 的 东西 。 这 个 定义 一 般 可 以 在 多 种 头 文 件 中 找到 ， 
包括 stddef.h、stdlib.h 和 stdio.h。 








如 果 编 译 器 用 一 个 非 零 的 位 串 来 表示 null， 那 么 编译 器 就 有 责任 在 指针 上 下 文中 把 
NULL 或 0 当做 null 指针 ， 实 际 的 null 内 部 表示 由 实现 定义 。 使 用 NULL 或 0 是 
在 语言 层面 表示 null 指针 的 符号 。 

ASCII 字符 NUL 定义 为 全 0 的 字 节 。 然 而 ， 这 跟 null 指针 不 一 样 。C 的 字符 串 表 
示 为 以 0 值 结尾 的 字符 序列 。null 字符 串 是 空 字 符 串 ， 不 包含 任何 字符 。 最 后 ， 
null 语句 就 是 只 有 一 个 分 号 的 语句 。 

接 下 来 我 们 会 看 到 ，nultl 指针 对 于 很 多 数据 结构 的 实现 来 说 都 是 很 有 用 的 特性 ， 比 
如 链表 经 常用 null 指针 来 表示 链表 结尾 。 


如 果 要 把 null 值 赋 给 pi， 就 像 下 面 那样 用 NULL: 


pi = NULL; 





于 马 ， 
et™ null 指针 和 未 初始 化 的 指针 不 同 。 未 初始 化 的 指针 可 能 包含 任何 值 ， 而 包 
AS 。 含 NULL 的 指针 则 不 会 引用 内 存 中 的 任何 地 址 。 
[DSN 





有 趣 的 是 ， 我 们 可 以 给 指针 赋 0， 但 是 不 能 赋 任 何 别 的 整数 值 。 看 一 下 下 面 的 赋值 
操作 : 


pi = 0; 
pi = NULL; 
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pi = 100; // 语法 错误 
pi = num; // 语法 错误 
指针 可 以 作为 逻辑 表达 式 的 唯一 操作 数 。 比 如 说 ， 我 们 可 以 用 下 面 的 代码 来 测试 指 
针 是 否 设置 成 了 NULL。 
if(pi) { 
// 不 是 NULL 


} else { 
// 是 NULL 


下 面 两 个 表达 式 都 有 效 ， 但 是 有 宛 余 。 这 样 可 能 更 清晰 ， 但 是 没 必 要 显 式 
。 地 跟 NULL 做 比较 。 
如 果 这 里 pi 被 赋 了 NULL 值 ， 那 就 会 被 解释 为 二 进 制 0。 在 C 中 这 表示 假 ， 那 么 倘 
车 pi 包含 NULL 的 话 ，else 分 支 就 会 执行 。 








if(pi == NULL) ... 
if(pi != NULL) ... 








任何 时 候 都 不 应 该 对 nutt 指针 进行 解 引 ， 因 为 它 并 不 包含 合法 地 址 。 执 
4 4 ， 行 这 样 的 代码 会 导致 程序 终止 。 
[DSN 
1. 用 不 用 NULL 


使 用 指针 时 哪 一 种 形式 更 好 ，NULL 还 是 0 ? 无 论 哪 一 种 都 完全 没 问题 ， 选 择 哪 种 只 
是 个 人 喜好 。 有 些 开发 者 喜欢 用 NULL， 因 为 这 样 会 提醒 自己 是 在 用 指针 。 另 一 些 人 
则 觉得 没 必要 ， 因 为 NULL 其 实 就 是 0。 

然而 ，NULL 不 应 该 用 在 指针 之 外 的 上 下 文中 。 有 时 候 可 能 有 用 ， 但 不 应 该 这 么 用 。 
如 果 人 代替 ASCII 字符 NUL 的 话 肯 定 会 有 问题 。 这 个 字符 没有 定义 在 标准 的 C 头 文件 
中 。 它 等 于 字符 '\0'， 其 值 等 于 十 进 制 0。 

0 的 含义 随 着 上 下 文 的 变化 而 变化 ， 有 时候 可 能 是 整数 0， 有 了 时候 又 可 能 是 null 指 
针 。 看 一 下 这 个 例子 : 





int num; 

int *pi = 0;  // 这 里 的 0 表示 null 的 指针 NULL 
pi = &num; 

*pi = 0; // 这 里 的 0 表示 整数 0 


我 们 习惯 了 重 载 的 操作 符 ， 比 如 星 号 可 以 用 来 声明 指针 、 解 引 指 针 或 者 做 乘法 。0 
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也 被 重 载 了 。 我 们 可 能 觉得 不 舒服 ， 因 为 还 没 习 惯 重 载 操作 数 。 
2. void 指针 


void 指针 是 通用 指针 ， 用 来 存放 任何 数据 类 型 的 引用 。 下 面 的 例子 就 是 一 个 void 
指针 : 


void *pyv; 
它 有 两 个 有 趣 的 性 质 : 


。 void 指针 具有 与 char 指针 相同 的 形式 和 内 存 对 齐 方 式 ， 
。 void 指针 和 别 的 指针 永远 不 会 相等 ， 不 过 ， 两 个 赋值 为 NULL 的 void 指针 是 相 


等 的 。 


任何 指针 都 可 以 被 赋 给 void 指针 ， 它 可 以 被 转换 回 原来 的 指针 类 型 ， 这 样 的 话 指 
针 的 值 和 原 指针 的 值 是 相等 的 。 在 下 面 的 代码 中 ，int 指针 被 赋 给 void 指针 然后 
又 被 赋 给 int 指针 : 

int num; 

int *pi = &num; 

printf("Value of pi: %p\n", pi); 

void* pv = pi; 

pi = (int*) pyv; 

printf("Value of pi: %p\n", pi); 


运行 这 段 代码 后 ， 指 针 地 址 是 一 样 的 : 


Value of pi: 100 
Value of pi: 100 


void 指针 只 用 做 数据 指针 ， 而 不 能 用 做 函数 指针 。 在 8.4.2 闻 中 ， 我 们 将 再 次 研究 
如 何 用 void 指针 来 解决 多 态 的 问题 。 


考 3 





用 void 指针 的 时 候 要 小 心 。 如 果 把 任意 指针 转换 为 void 指针 ， 那 就 没有 
。 什 么 能 阻止 你 再 把 它 转换 成 不 同 的 指针 类 型 了 。 























sizeof 操作 符 可 以 用 在 void 指针 上 ， 不 过 我 们 无 法 把 这 个 操作 符 用 在 void 上 ， 
如 下 所 示 : 


size t size = sizeof(void*); // 合法 
size t size = sizeof(void); // 不 合法 


size _t 是 用 来 表示 长 度 的 数据 类 型 ， 会 在 1.2.2 市 中 讨论 。 
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3. 全 局 和 静态 指针 


指针 被 声明 为 全 局 或 静态 ， 就 会 在 程序 启动 时 被 初始 化 为 NULL。 下 面 是 全 局 和 静态 
指针 的 例子 : 





int *globalpi; 


void foo() { 
static int *staticpi; 


} 

int main() { 

} 
图 1-6 说 明了 内 存 布局 ， 栈 帧 被 推 入 栈 中 ， 堆 用 来 动态 分 配 内 存 ， 堆 上 面 的 区 域 用 
来 存放 全 局 /静态 变量 。 这 只 是 原理 图 ， 静 态 和 全 局 变量 一 般 放 在 与 栈 和 堆 所 处 的 
数据 段 不 同 的 数据 段 中 。 栈 和 堆 将 在 3.1 节 讨 论 。 
































静态 /全 局 | globalpi |_NULL 


staticpi | NULL 


main 














1-6: 全 局 和 阁 态 指针 的 内 存 分 配 


1.2 ”指针 的 长 度 和 类 型 

如 果 考 虑 应 用 程序 的 兼容 性 和 可 移植 性 ， 指 针 长 度 就 是 一 个 问题 。 在 大 部 分 现代 平 
台 上 ， 数 据 指针 的 长 度 通 常 是 一 样 的 ， 与 指针 类 型 无 关 ，char 指针 和 结构 体 指针 长 
度 相 同 。 尽 管 C 标准 没有 规定 所 有 数据 类 型 的 指针 长 度 相 同 ， 但 是 通常 实际 情况 就 
是 这 样 。 不 过 ， 国 数 指针 长 度 可 能 与 数据 指针 长 度 不 同 。 

指针 长 度 取决 于 使 用 的 机 器 和 编译 器 。 比 如 ， 在 现代 Windows 上 ， 指 针 是 32 位 或 
64 位 长 。 对 于 DOS 和 Windows 3.1 来 说 ， 指 针 则 是 16 位 或 32 位 长 。 


1.2.1 内存 模 型 
64 位 机 器 的 出 现 导 致 为 不 同 数据 类 型 分 配 的 内 存在 长 度 上 的 差异 变 得 明显 。 不 同 的 
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机 器 和 编译 器 在 给 C 的 基本 数据 类 型 分 配 空间 上 有 不 同 的 做 法 。 用 来 描述 不 同 数据 
模型 的 一 种 通用 表示 法 总 结 如 下 : 

















IInLLnLLLLnPPn 


每 个 大 写字 母 对 应 整数 、 长 整数 或 指针 ， 小 写字 母 表示 为 该 数据 类 型 分 配 的 位 数 。 
表 1-3 总 结 了 这 些 模型 ， 其 中 数字 表示 位 数 。 


表 1-3: 机 器 内 存 模型 








C 数 据 类 型 LP64 ILP64 LLP64 ILP32 LP32 
char 8 8 8 8 8 
short 16 16 16 16 16 
_int32 32 

int 32 64 32 32 16 
long 64 64 32 32 32 
long long 64 

pointer 64 64 64 32 32 


模型 取决 于 操作 系统 和 编译 器 ， 一 种 操作 系统 可 能 支持 多 种 模型 ， 这 通常 是 用 编译 
器 选项 来 控制 的 。 





1.2.2 ”指针 相关 的 预定 义 类 型 
使 用 指针 时 经 常用 到 以 下 四 种 预定 义 类 型 。 





。 size t 

用 于 安全 地 表示 长 度 。 
。 ptrdiff t 

用 于 处 理 指 针 算术 运算 。 





。 intptr t 和 uintptr t 
用 于 存储 指针 地 址 。 


下 面 将 展示 每 种 类 型 的 用 法 ，ptrdiff 七 除外 ， 我 们 会 在 1.3.1 节 的 “两 个 指针 相 
减 ” 中 讨论 它 。 


1. 理解 size 七 





size t 类 型 表示 C 中 任何 对 象 所 能 达到 的 最 大 长 度 。 它 是 无 符号 整数 ， 因 为 负数 
在 这 里 没有 意义 。 它 的 目的 是 提供 一 种 可 移植 的 方法 来 声明 与 系统 中 可 寻 址 的 内 存 
区 域 一 致 的 长 度 。size 七 用 做 sizeof 操作 符 的 返回 值 类 型 ， 同 时 也 是 很 多 函数 的 
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参数 类 型 ， 包 括 malloc 和 strlen。 


过 
在 声明 诸如 字符 数 或 者 数组 索引 这 样 的 长 度 变量 时 用 size_t 是 好 的 做 法 。 
心 。 它 经 常用 于 循环 计数 器 、 数 组 索引 ， 有 时 候 还 用 在 指针 算术 运算 上 。 


， 
0, 











size t 的 声明 是 实现 相关 的 。 它 出 现在 一 个 或 多 个 标准 头 文件 中 ， 比 如 stdio.h 和 
stblib.h， 典 型 的 定义 如 下 : 





#ifndef SIZE T 

#define _ SIZE T 

typedef unsigned int size t; 
#endif 


define 指令 确保 它 只 被 定义 一 次 。 实 际 的 长 度 取决 于 实现 。 通 常 在 32 位 系统 上 它 


的 长 度 是 32 位 ， 而 在 64 位 系统 上 则 是 64 位 。 一 般 来 说 ，size t 可 能 的 最 大 值 是 
SIZE_MAX。 





通常 size t 可 以 用 来 存放 指针 ， 但 是 假定 size t 和 指针 一 样 长 不 是 个 
一 3》 好 主意 。 稍 后 的 “使 用 sizeof 操作 符 和 指针 ”会 讲 到 ，intptr_t 是 更 好 
的 选择 。 











打印 size t 类 型 的 值 时 要 小 心 。 这 是 无 符号 值 ， 如 果 选 错 格 式 说 明 符 ， 可 能 会 得 
到 不 可 靠 的 结果 。 推 荐 的 格式 说 明 符 是 %zu。 不 过 ， 某 些 情况 下 不 能 用 这 个 说 明 符 ， 
作为 替代 ， 可 以 考虑 %u 或 %Lu。 


下 面 这 个 例子 将 一 个 变量 定义 为 size 七 ， 然 后 用 两 种 不 同 的 格式 说 明 符 来 打印 : 


size t sizet = -5; 
printf("%d\n",sizet); 
printf("%zu\n",sizet); 


因为 size _t 本 来 是 用 于 表示 正 整数 的 ， 如 果 用 来 表示 负数 就 会 出 问题 。 如 果 为 其 
赋 一 个 负数 ， 然 后 用 %d 和 %zu 格式 说 明 符 打印 ， 就 得 到 如 下 结果 : 

-5 

4294967291 
%d 把 size _t 当做 有 符号 整数 ， 它 打印 出 -5 因为 变量 中 存放 的 就 是 -5。%zu 把 
size_t 当做 无 符号 整数 。 当 -5 被 解析 为 有 符号 数 时 ， 高 位 置 为 1， 表示 这 个 数 是 
负数 。 当 它 被 解析 为 无 符号 数 时 ， 高 位 的 1 被 当做 2 的 乘 需 。 所 以 在 用 %zu 格式 说 
明 符 时 才 会 看 到 那个 大 整数 。 





正 数 会 正常 显示 ， 如 下 所 示 : 


Sizet = 5; 
printf("%d\n",sizet); // 显示 5 
printf("%zu\n",sizet); // 显示 5 


因为 size _t 是 无 符号 的 ， 一 定 要 给 这 种 类 型 的 变量 赋 正 数 。 


2. 对 指针 使 用 sizeof 操 作 符 
sizeof 操作 符 可 以 用 来 判断 指针 长 度 。 下 面 的 代码 
printf("Size of *char: %d\n",sizeof (char*)); 


输出 如 下 : 
Size of *char: 4 


说 羽 
1 








0, 


显示 char 指针 的 长 度 : 


a 当 需 要 用 指针 长 度 时 ， 一 定 要 用 sizeof 操作 符 。 


函数 指针 的 长 度 是 可 变 的 。 通 常 ， 对 于 给 定 的 操作 系统 和 编译 器 组 合 ， 它 是 固定 的 。 
很 多 编译 器 支持 创建 32 位 和 64 位 应 用 程序 ， 所 以 对 于 同一 个 程序 来 说 ,不 同 的 纺 








译 选 项 可 能 会 导致 其 使 用 不 同 的 指针 长 度 。 
在 Harvard 架构 上 ， 人 代码 和 数据 存储 在 不 同 的 物理 





内 存 中 。 比 如 Intel 的 MCS-51 


(8051) 微 处 理 器 就 是 Harvard 架构 。 尽 管 Intel 不 再 生产 这 种 芯片 ， 但 现在 还 是 有 
很 多 二 进 制 兼容 的 衍生 品 在 使 用 。Small Device C Complier (SDCC) 就 支持 这 类 处 





理 器 (参见 http://sdcc.sourceforge.net/doc/sdccman.pdf)。 这 种 机 器 的 指针 长 度 可 能 





介 于 1 到 4 字 节 之 间 ， 因 此 指针 长 度 应 该 在 需要 时 再 确定 ， 原 因 是 在 这 种 环境 中 它 








并 不 固定 。 


3. 使 用 intptr_ t 和 uintptr 七 


intptr_t 和 uintptr_t 类 型 用 来 存放 指针 地 址 。 它 们 提供 了 一 种 可 移植 且 安 全 的 


方法 声明 指针 ， 而 且 和 系统 中 使 用 的 指针 长 度 相同 ， 
说 很 有 用 。 


对 于 把 指针 转化 成 整数 形式 来 


uintptr t 是 intptr t 的 无 符号 版 本 。 对 于 大 部 分 操作 ， 用 intptr t 比较 好 。 
uintptr tt 不 像 intptr tt 那样 灵活 。 下 面 的 例子 说 明 如 何 使 用 ijntptr t: 
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int num; 
intptr t *pi = &num; 


如 果 像 下 面 那样 试图 把 整数 地 址 赋 给 uintptr_t 类 型 的 指针 ， 我 们 会 得 到 一 个 语法 
错误 : 








uintptr t *pu = Snum; 
错误 看 起 来 是 这 样 的 : 


error: invalid conversion from 'int*' to 
'uintptr t* {aka unsigned int*}' [-fpermissive] 


不 过 ， 用 强制 类 型 转换 来 赋值 是 可 以 的 : 


intptr t *pi = &num; 
uintptr t *pu = (uintptr t*)é&num; 


如 果 不 转换 类 型 ， 不 能 将 uintptr t 用 于 其 他 类 型 ; 


char c; 
uintptr t *pc = (uintptr t*)é&c; 


当 可 移植 性 和 安全 性 变 得 重要 时 ， 就 应 该 使 用 这 些 类 型 。 不 过 ， 为 简 音 起见， 我们 
的 例子 中 不 会 使 用 。 





-Ee 避免 把 指针 转换 成 整数 。 如 果 指 针 是 64 位 ， 整 数 只 有 4 字 节 时 就 会 丢失 信息 。 





赚 六 
1 





早期 的 Intel 处 理 器 采用 16 位 的 分 段 架构 ， 近 指针 和 远 指 针 也 是 相对 的 。 

心 。 今 天 的 虚拟 内 存 架构 上 就 不 是 这 样 了 。 远 指针 和 近 指 针 是 C 标准 的 扩展 ， 
一 慌 用 来 支持 早期 的 Intel 处 理 器 的 分 段 架 构 。 近 指针 一 次 只 能 寻 址 64 KB 的 
内 存 。 远 指针 最 多 可 以 寻 址 1 MB 内 存 ， 但 是 比 近 指 针 慢 。 巨 指针 是 规范 
化 过 的 远 指针 ， 使 用 尽 可 能 高 的 段 。 




















1.3 ”指针 操作 符 


指针 有 儿 类 操作 符 。 目 前 我 们 已 经 接触 过 解 引 和 取 地 址 操作 符 ， 本 市 将 近 距 离 研 究 
指针 算术 运算 和 比较 。 表 1-4 总 结 了 指针 操作 符 。 





表 1-4: 指针 操作 符 
































操 作 符 名 称 2 

用 来 声明 指针 

解 引 用 来 解 引 指针 

ei 指向 用 来 访问 指针 引用 的 结构 的 字段 
+ 加 用 于 对 指针 做 加 法 

= 减 用 于 对 指针 做 减法 

二 = 相等 、 不 等 比较 两 个 指针 

2 大 于 、 大 于 等 于 、 小 于 、 小 于 等 于 比较 两 个 指针 

(数据 类 型 ) 转换 改变 指针 的 类 型 


1.3.1 指针 算术 运算 

数据 指针 可 以 执行 以 下 几 种 算术 运算 : 

。 给 指针 加 上 整数 ， 

。 从 指针 减 去 整数 ; 

。 两 个 指针 相 减 ， 

。 比较 指针 。 

函数 指针 则 不 一 定 。 

1. 给 指针 加 上 整数 

这 种 操作 很 普遍 也 很 有 用 。 给 指针 加 上 一 个 整数 实际 上 加 的 数 是 这 个 整数 和 指针 数 
据 类 型 对 应 字 节 数 的 乘积 。 

各 个 系统 的 基本 数据 类 型 长 度 可 能 不 同 ， 正 如 1.2.1 节 所 述 。 表 1-5 显示 了 大 部 分 系 
统 的 常见 长 度 ， 除 非特 别 指定 ， 本 书 的 示例 会 使 用 这 里 的 值 。 

表 1-5: 数据 类 型 长 度 


数据 类 型 长 度 ( 字 节 ) 
byte 





char 
short 
int 
Long 
float 
double 


为 了 说 明 给 指针 加 上 整数 的 效果 ， 我 们 会 使 用 一 个 整数 数组 ， 如 下 所 示 。 每 次 pi 
加 1， 地 址 就 加 4。 这 些 变量 的 内 存 分 配 如 图 1-7 所 示 。 指 针 是 用 数据 类 型 声明 的 ， 


oo 上 oo DD 一 -~ 
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以 便 执 行 算术 运算 。 这 种 自动 调整 指针 值 的 可 移植 方法 之 所 以 可 能 ， 前 提 就 是 知道 
数据 类 型 的 大 小 。 


int vector[] = {28, 41, 7}; 


int *pi = vector; // pi: 100 
printf("%d\n",*pi); // 显示 28 
pi += 1; // pi: 104 
printf("%d\n",*pi); // 显示 41 
pi += 1; // pi: 108 
printf("%d\n",*pi); // 显示 7 





果 这 里 使 用 数组 的 名 字 ， 返回 的 只 是 数组 地 址 ， 也 就 是 数组 第 一 个 元 素 
”的 地 址 。 


3 
= 














vector[0] 100 
vector[1] 104 
vector[2] 108 

pi112 | 100 | 














1-7: vector 数组 的 内 存 分 配 情 ) 
在 下 面 的 代码 中 ， 我 们 给 指针 加 3，pi 变量 会 包含 地 址 112， 就 是 pi 本 身 的 地 址 : 


pi = vector; 

pi += 3; 
指针 指向 了 自己 ， 这 样 没什么 用 ,但 是 说 明了 在 做 指针 算术 运算 时 要 小 心 。 访 问 超 
出 数组 范围 的 内 存 很 危险 ， 应 该 避免 。 没 有 什么 能 保证 被 访问 的 内 存 是 有 效 变 量 
存 取 无 效 或 无 用 地 址 的 情况 很 容易 发 生 。 
下 面 的 代码 演示 了 short 和 char 类 型 指针 的 加 法 操作 : 


short s; 
Short *ps = &s; 
char c; 
char *pc = &c; 


我 们 假设 内 存 分 配 如 图 1-8 所 示 ， 这 里 用 到 的 地 址 以 4 字 市 为 界 。 真实 的 地 址 可 能 
涉及 不 同 的 字 市 数 和 不 同 的 字 市 序 。 














s120| .| 
ps124 
C128| … | 
pc132 











1-8: short 和 char 指针 
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下 面 的 代码 给 每 个 指针 加 1 然后 显示 内 容 : 


printf("Content of ps before: %d\n",ps); 
ps = ps +1; 
printf("Content of ps after: %d\n",ps); 


printf("Content of pc before: %d\n",pc); 
pcC= pc+1; 
printf("Content of pc after: %d\n",pc); 


运行 后 ， 你 应 该 能 得 到 类 似 如 下 的 结果 : 
Content of ps before: 120 
Content of ps after: 122 


Content of pc before: 128 
Address of pc after: 129 


ps 指针 增加 了 2， 因为 short 的 长 度 是 2 字 方 。pc 指针 增加 了 1， 因为 它 的 数据 类 
型 长 1 字 节 。 这 些 地 址 可 能 没有 包含 有 用 的 信息 。 
2. void 指针 和 加 法 
作为 扩展 ， 大 部 分 编译 器 都 允许 给 void 指针 做 算术 运算 ， 这 里 我 们 假设 void 指针 
的 长 度 是 4。 不 过 ， 试 图 给 void 指针 加 1 可 能 导致 语法 错误 。 在 下 面 的 代码 片段 
中 ， 我 们 声明 指针 并 试图 给 它 加 1: 

int num = 5; 

void *pv = Snum; 


printf("%p\n",pv); 
pv = pv+l; // 语法 警告 


下 面 是 警告 信息 : 
warning: pointer of type 'void *' used in arithmetic [-Wpointerarith] 
这 不 是 标准 C 允许 的 行为 ， 所 以 编译 器 发 出 了 敬告。 不过，pyv 包含 的 地 址 增加 了 4 
字 节 。 
3. 从 指针 减 去 整数 
就 像 整 数 可 以 和 指针 相 加 一 样 ， 也 能 从 指针 减 去 整数 。 减 去 整数 时 ， 地 址 值 会 减 去 


数据 类 型 的 长 度 和 整数 值 的 乘积 。 为 了 演示 从 指针 减 去 整数 的 效果 ， 我 们 使 用 如 下 
所 示 的 数组 。 这 些 变 量 的 内 存 分 配 如 图 1-7 所 示 。 

















int vector[] = {28, 41, 7}; 
int *pi = vector + 2; // pi: 108 


printf("%d\n",*pi); // 显示 7 





认识 指针 | 21 





pi--; // pi: 104 
printf("%d\n",*pi); // 显示 41 
pi--; // pi: 100 
printf("%d\n",*pi); // 显示 28 


pi 每 次 减 1， 地 址 都 会 减 4。 
4. 指针 相 减 


一 个 指针 减 去 另 一 个 指针 会 得 到 两 个 地 址 的 差 值 。 这 个 差 值 通常 没什么 用 ， 但 可 以 
判断 数组 中 的 元 素 顺 序 。 


指针 之 间 的 差 值 是 它们 之 间 相 差 的 “单位 ” 数 ， 差 的 符号 取决 于 操作 数 的 顺序 。 这 
和 指针 加 法 是 一 样 的 ， 加 到 指针 上 的 是 数据 的 长 度 。 我 们 把 “单位 ”当做 操作 数 。 
在 下 例 中 ， 我 们 声明 一 个 数组 和 数组 元 素 的 指针 ， 然 后 相 减 : 

int vector[] = {28, 41, 7}; 

int *pQO = vector; 


int *pl = Vector+1; 
int *p2 = vector+2; 








printf("p2-p0: %d\n",p2-p0); // p2-p0: 2 
printf("p2-pl: %d\n",p2-p1); // p2-pl: 1 
printf("p0-p1: %d\n",p0-pl1); // p0-p1: -1 





在 第 一 个 printf 语句 中 ， 我 们 看 到 数组 的 最 后 一 个 和 第 一 个 元 素 的 位 置 相差 2， 
就 是 说 它们 的 索引 值 相差 2。 在 最 后 一 个 printf 语句 中 ， 差 值 是 -1， 表 示 pg 在 
pl 前 面 ， 而 且 它 们 紧 挨 着 。 图 1-9 说 明了 本 例 中 内 存 的 分 配 情况 。 














vector[0] 100 
vector[1] 104 
vector[2] 108 












图 1-9: 指针 相 减 


ptrdiff t 类 型 表示 两 个 指针 差 值 的 可 移植 方式 。 在 上 例 中 ， 指 针 相 减 的 结果 以 
ptrdiff tt 类 型 返回 。 因 为 指针 长 度 可 能 不 同 ， 这 个 类 型 简化 了 处 理 差 值 的 任务 。 


不 要 把 这 种 技术 和 利用 解 引 操作 来 做 数字 相 减 混淆 。 在 下 例 中 ， 我 们 用 指针 来 确定 
数字 中 第 一 个 元 素 和 第 二 个 元 素 中 存储 的 值 的 差 。 























printf("*pO-*pl: %d\n",*pO-*p1); // *p0-*pl: -13 
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1.3.2 ”比较 指针 
指针 可 以 用 标准 的 比较 操作 符 来 比较 。 通 常 ， 比 较 指 针 没什么 用 。 然 而 ， 当 把 指针 
和 数组 元 素 相 比 时 ， 比 较 结 果 可 以 用 来 判断 数组 元 素 的 相对 顺序 。 


我 们 仍然 用 前 面 “指针 相 减 ”中 使 用 的 vector 数组 来 说 明 指针 的 比较 。 这 里 用 到 
了 几 种 比较 操作 符 ， 结 果 为 1 表示 真 ， 为 0 表示 假 : 


int vector[] = {28, 41, 7}; 
int *pQ = vector; 

int *pl1 = Vector+1; 

int *p2 = vector+2; 

















printf("p2>p0: %d\n",p2>p0); // p2>p0: 1 
printf("p2<p0: %d\n",p2<p0); // p2<p0: 0 
printf("pO>pl: %d\n" ,pO>p1); // pO>pl: 0 


1.4 ”指针 的 常见 用 法 
指针 用 处 很 多 。 在 本 节 中 ， 我 们 探讨 指针 的 不 同 用 法 ， 包 括 : 


。 多 层 间 接 引 用 ， 
。 常量 指针 。 


1.4.1 多 层 间 接 引 用 

指针 可 以 用 不 同 的 间接 引用 层级 。 把 变量 声明 为 指针 的 指针 并 不 少见 ， 有 时 候 称 它 
们 为 双重 指针 。 一 个 很 好 的 例子 就 是 用 传统 的 argv 和 argc 参数 来 给 main 国 数 传 
递 程序 参数 ， 第 5 章 将 详细 讨论 。 


下 例 使 用 了 三 个 数组 。 第 一 个 数组 是 用 来 存储 书 名 列表 的 字符 串 数组 


Char *titles[] = {"A Tale of Two Cities", 
"Wuthering Heights","Don Quixote", 
"QOdyssey","Moby-Dick","Hamlet", 
"Gulliver's Travels"}; 








还 有 两 个 数组 分 别 用 来 维护 一 个 “畅销 书 ” 列 表 和 一 个 英文 书 列表 。 这 两 个 数组 保 
存 的 是 titles 数组 里 书 名 的 地 址 ， 而 不 是 书 名 的 副本 。 两 个 数组 都 声明 为 字符 指 
针 的 指针 。 数 组 元 素 会 保存 titles 数组 中 元 素 的 地 址 ， 这 样 可 以 避免 对 每 个 书 名 
重复 分 配 内 存 ， 确 保 每 个 书 名 的 位 置 唯一 。 如 果 需 要 修改 书 名 ， 只 改 一 个 地 方 就 可 
以 了 。 


另外 两 个 数组 声明 如 下 。 每 个 数组 元 素 包 含 一 个 指向 char 指针 的 指针 。 
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char **bestBooks[3]; 
char **englishBooks[4]; 


接 下 来 初始 化 这 两 个 数组 ， 然 后 打印 其 中 一 个 元 素 ， 如 下 所 示 。 在 赋值 语句 中 ， 碳 
边 的 值 是 通过 先 做 下 标 索 引 再 取 地 址 的 操作 得 到 的 。 比 如 说 第 二 个 语 名 把 titles 
数组 中 第 4 个 元 素 的 地 址 赋 给 bestBooks 的 第 2 个 元 素 : 























bestBooks[0] = &titles[0]; 
bestBooks[1] = S&titles[3]; 
bestBooks[2] = &titles[5]; 
englishBooks[0] = &titles[0]; 
englishBooks[1] = &titles[1]; 
englishBooks[2] = &titles[5]; 
englishBooks[3] = &titles[6]; 


printf("%s\n",*englishBooks[1]); // Wuthering Heights 


本 例 的 内 存 分 配 如 图 1-10 所 示 。 








bestBooks title[0] “ATale of Two Cities” 
bestBooks[ title[1] “Wuthering Heights” 
bestBooks title[2 


title[3] Odyssey” 
title[4] 
title[5] 
title[6] “Gullivers Travels” | 


englishBooks[ 
englishBooks 
englishBooks[ 
englishBooks 























图 1-10: 指针 的 指针 


用 多 层 间接 引用 可 以 为 代码 的 编写 和 使 用 提供 更 多 的 灵活 性 ， 否 则 有 些 操作 实现 起 
来 会 困难 一 些 。 在 本 例 中 ， 如 果 书 名 的 地 址 变 了 ， 那 么 只 需要 修改 titles 数组 即 
可 ， 不 需要 修改 其 他 两 个 数组 。 


间接 引用 没有 层 数 限制 ， 当 然 ， 使 用 的 层 数 过 多 会 让 人 迷惑 ， 很 难 维护 。 
1.4.2 ”常量 与 指针 
C 语言 的 功能 强大 而 丰富 ， 还 表现 在 const 关键 字 与 指针 的 结合 使 用 上 。 对 不 同 的 


问题 ， 它 能 提供 不 同 的 保护 。 特 别 强大 和 有 用 的 是 指向 常量 的 指针 。 在 第 3 章 和 第 
5 章 ， 我 们 将 看 到 如 何 用 这 种 技术 来 阻止 函数 的 使 用 者 修改 函数 的 参数 。 


1. 指向 常量 的 指针 
可 以 将 指针 定义 为 指向 常量 ， 这 意味 着 不 能 通过 指针 修改 它 所 引用 的 值 。 下 例 声 明 





















































了 一 个 整数 和 一 个 整数 常量 ， 然 后 声明 了 一 个 整数 指针 和 一 个 指向 整数 党 


并 分 别 初始 化 为 对 应 的 整数 : 


int num = 5; 
const int limit = 500; 














int *pi; // 指向 整数 
const int *pci; // 指向 整数 常量 
pi = &num; 


pci = &limit; 


图 1-11 是 它们 的 内 存 分 配 情 ; 


量 的 指针 ， 

















图 1-11: 指向 整数 常量 的 指针 
下 面 的 代码 会 打印 这 些 变 量 的 地 址 和 值 : 


printf(" num - Address: %p value: %d\n",&num, num); 
printf("Limit - Address: %p value: %d\n",&limit, limit); 
printf(" pi - Address: %p value: %p\n",&pi, pi); 
printf(" pci - Address: %p value: %p\n",&pci, pci); 


运行 代码 会 产生 类 似 下 面 的 输出 : 





num - Address: 100 value: 5 
limit - Address: 104 value: 500 
pi - Address: 108 value: 100 
pci - Address: 112 value: 104 


如 果 只 是 读 取 整 数 的 值 ， 那 么 引用 指向 常量 的 指针 就 没事 ， 读 取 是 完全 


且 也 是 必要 的 功能 ， 如 下 所 示 : 


printf("%d\n", *pci); 


合法 的 ， 而 


我 们 不 能 解 引 指向 常量 的 指针 并 改变 指针 所 引用 的 值 ， 但 可 以 改变 指针 。 指 针 的 值 
不 是 常量 。 指 针 可 以 改 为 引用 另 一 个 整数 常量 ,或 者 普通 整数 。 这 样 做 不 会 有 问题 











声明 只 是 限制 我 们 不 能 通过 指针 来 修改 引用 的 值 。 
这 意味 着 下 面 的 赋值 是 合法 的 : 

















pci = &num; 


我 们 可 以 解 引 pci 来 读 取 它 ， 但 不 能 解 引 它 来 修改 它 。 
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考虑 下 面 的 赋值 语句 : 
*pci = 200; 
这 会 导致 如 下 语法 错误 : 
‘pci' : you cannot assign to a variable that is const 
指针 认为 自己 指向 的 是 整数 常量 ， 所 以 不 允许 用 指针 来 修改 这 个 整数 。 我 们 还 是 可 
以 通过 名 字 来 修改 num 变量 ， 只 是 不 能 用 pci 来 修改 。 
理论 上 来 说 ， 常 量 的 指针 也 可 以 如 图 1-12 那样 可 视 化 ， 普 通 方 框 表示 变量 ， 阴 影 方 


框 表示 常量 。pci 指向 的 阴影 方 框 不 能 用 pci 来 修改 ， 虚 线 表示 指针 可 以 引用 的 数 
据 类 型 。 在 上 例 中 ，pci 指向 Limit。 


int num; [ |] 

int *pi; CC] bine bs[| | int 

const int limit = 100; 

const int *pci; CJ |int 或 const int 


图 1-12: 指向 常量 的 指针 
把 pci 声明 为 指向 整数 常量 的 指针 意味 着 : 


。 pci 可 以 被 修改 为 指向 不 同 的 整数 常量 ; 

。 pci 可 以 被 修改 为 指向 不 同 的 非 整 数 常量 ; 
。 可 以 解 引 pci 以 读 取 数 据 ， 

。 不 能 解 引 pci 从 而 修改 它 指向 的 数据 。 











数据 类 型 和 const 关键 字 的 顺序 不 重要 。 下 面 两 个 语句 是 等 价 的 : 








const int *pci,; 
int const *pci; 


2. 指向 非常 量 的 常量 指针 


也 可 以 声明 一 个 指向 非常 量 的 常量 指针 。 这 么 做 意味 着 指针 不 可 变 , 但 是 它 指向 的 
数据 可 变 。 下 面 是 这 种 指针 的 例子 ， 


int num; 
int *const cpi = &num; 








。 cpi 必须 被 初始 化 为 指向 非常 量变 量 ， 
。 cpi 不 能 被 修改 ， 
。 cpi 指向 的 数据 可 以 被 修改 。 


从 原理 上 说 ， 这 类 指针 可 以 用 图 1-13 来 说 明 。 


int num; [ |] 
int * const cpi = &num; EE TE |int 


1-13: 指向 非常 量 的 常量 指针 


无 论 cpi 引用 了 什么 ， 都 可 以 解 引 cpi 然后 赋 一 个 新 值 。 下 面 是 两 条 合法 的 赋值 语句 : 














Limit 
ys 


*cpi 
*cpi 























朵 





然而 ， 如 果 我 们 试图 把 cpi 初始 化 为 指向 常量 Limit， 如 下 所 示 : 


Const int Limit = 500; 
int *const cpi = ALimit ; 


那么 就 会 产生 一 个 警告 : 


warning: initialization discards qualifiers from pointer target type 





如 果 这 里 cpi 引用 了 常量 Limit， 那 常量 就 可 以 修改 了 。 这 样 不 对 ， 因 为 常量 是 不 
能 被 修改 的 。 


在 把 地 址 赋 给 cpi 之 后 ， 就 不 能 像 下 面 这 样 再 赋 给 它 一 个 新 值 了 : 











int num; 

int age; 

int *const cpi = &num; 
cpi = &age; 


如 果 采 用 这 种 做 法 会 产生 如 下 错误 信息 : 
‘cpi' : you cannot assign to a variable that is const 
3. 指向 常量 的 常量 指针 
指向 常量 的 常量 指针 很 少 派 上 用 场 。 这 种 指针 本 身 不 能 修改 ， 它 指向 的 数据 也 不 能 
通过 它 来 修改 。 下 面 是 指向 常量 的 常量 指针 的 一 个 例子 : 


const int * const cpci = &limit; 


指向 常量 的 常量 指针 可 以 用 图 1-14 来 说 明 。 
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int num; [ |] 
const int limit = 100; 


const int * const cpci = glimit;[ | 人 jint 或 const int 








1-14: 指向 常量 的 常量 指针 


与 指向 常量 的 指针 类 似 ， 不 一 定 只 能 将 常量 的 地 址 赋 给 cpci。 如 下 所 示 ， 我 们 


还 可 以 把 num 的 地 址 赋 给 cpci: 


int num; 
const int * Const cpci = Snum; 


声明 指针 时 必须 进行 初始 化 。 如 果 像 下 面 这 样 不 进行 初始 化 : 





const int * Const cpci; 
就 会 产生 如 下 语法 错误 : 

"cpci' : const object must be initialized if not extern 
对 于 指向 常量 的 常量 指针 ， 我 们 不 能 : 


。 修改 指针 ， 
。 修改 指针 指向 的 数据 。 


重新 赋 给 cpci 一 个 新 地 址 : 














cpci = &num; 
会 导致 如 下 语法 错误 : 
'cpci' : you cannot assign to a variable that is const 


像 下 面 这 样 试图 解 引 指针 并 赋 新 值 : 








*cpci = 25; 
会 产生 如 下 错误 : 
"cpci' : you cannot assign to a variable that is const 


expression must be a modifiable lvalue 
不 过 ， 指 向 常量 的 常量 指针 很 少 用 到 。 
4. 指向 “指向 常量 的 常量 指针 ”的 指针 


其 实 


天 





指向 常量 的 指针 也 可 以 有 多 层 间接 引用 。 在 下 例 中 ， 我 们 声明 一 个 指向 上 一 节 提 到 
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的 cpci 指针 的 指针 。 从 右 往 左 读 可 以 帮助 我 们 理解 这 个 声明 : 





Const int * const cpci = ALimit 
const int * const * pcpci; 





指向 “指向 常量 的 常量 指针 ”的 指针 可 以 用 图 1-15 来 说 明 。 








const int limit = 500; 500 
const int * const cpci = &limit; [CE | | 
const int * const * pcpci = &cpci; CC [| 


1-15; 指向 “指向 常量 的 常量 指针 ”的 指针 











下 面 说明 它 们 的 使 用 。 这 段 代码 的 输出 应 该 是 两 个 500: 
printf("%d\n",*cpci); 
pcpci = &cpci; 


printf("%d\n",**pcpci); 


下 表 总 结 了 本 市 讨论 的 前 四 种 指针 。 





























指针 类 型 指针 是 否 可 修改 指向 指针 的 数据 是 否 可 修改 
指向 非常 量 的 指针 是 是 
指向 常量 的 指针 是 否 
指向 非常 量 的 常量 指针 否 是 
指向 常量 的 常量 指针 否 否 














1.5 小结 

本 章 讨论 了 指针 的 基本 概念 ， 包 括 如 何 声明 指针 ， 在 和 常见 的 场景 中 如 何 使 用 指针 。 
我 们 也 提 到 了 nultl 的 有 趣 概念 和 它 的 变种 ， 还 有 一 系列 指针 操作 符 。 

我 们 知道 了 指针 的 长 度 是 可 变 的 ， 它 取决 于 目标 系统 和 编译 器 支持 的 内 存 模型 。 我 
们 也 探索 了 const 关键 字 和 指针 一 起 使 用 的 问题 。 

有 了 这 些 基础 知识 ， 下 一 步 就 可 以 探讨 那些 指针 可 以 大 显 身手 的 领域 了 。 这 些 领 域 
包括 把 指针 作为 函数 参数 、 辅 助 创建 数据 结构 ， 以 及 指针 在 动态 内 存 分 配 中 的 应 用 。 
另外 ， 我 们 也 会 看 到 指针 如 何 让 应 用 程序 更 安全 。 
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[的 动态 内 存 管 理 





指针 的 强大 很 大 程度 上 源 于 它们 能 追踪 动态 分 配 的 内 存 。 通 过 指针 来 管理 这 部 分 内 
存 是 很 多 操作 的 基础 ， 包 括 一 些 用 来 处 理 复杂 数据 结构 的 操作 。 要 完全 利用 这 些 能 
力 ， 需 要 理解 C 的 动态 内 存 管理 是 怎么 回 事 。 





C 程序 在 运行 时 环境 中 执行 ， 这 通常 是 由 操作 系统 提供 的 环境 ， 支 持 栈 和 堆 以 及 其 
他 的 程序 行为 。 


内 存 管理 对 所 有 程序 来 说 都 很 重要 。 有 时 候 内 存 由 运行 时 系统 隐 式 地 管理 ， 比 如 为 
自动 变量 分 配 内 存 。 在 这 种 情况 下 ， 变 量 分 配 在 它 所 处 的 函数 的 栈 帧 上 。 如 果 是 静 
态 或 全 局 变量 ， 内 存 处 于 程序 的 数据 段 ， 会 被 自动 清 零 。 数 据 段 是 一 个 区 别 于 可 执 
行 代 码 和 运行 时 系统 管理 的 其 他 数据 的 内 存 区 域 。 


由 于 可 以 先 分 配 内 存 然后 释放 ， 因 而 应 用 程序 可 以 更 灵活 高 效 地 管理 内 存 ， 无 需 为 
适应 数据 结构 可 能 的 最 大 长 度 分 配 内 存 ， 只 要 分 配 实际 需要 的 内 存 即 可 。 


比如 ， 在 C99 以 前 数组 是 固定 长 度 的 。 如 果 我 们 要 持 有 可 变数 量 的 元 素 ， 比 如 员工 
记录 ， 可 能 就 必须 声明 一 个 足够 大 的 数组 来 装 下 可 能 的 最 大 员工 数 。 如 果 我 们 低估 
了 这 个 值 ， 那 就 只 能 重新 编译 应 用 程序 或 是 采用 别 的 办 法 。 如 果 高 估 了 ， 那 就 会 浪费 
空间 。 动 态 分 配 内 存 的 能 力也 对 使 用 链表 或 队列 等 可 变数 量 元 素 的 数据 结构 有 帮助 。 


























4 


C99 引入 了 变 长 数组 (VLA)。 数 组 长 度 在 运行 时 而 不 是 编译 时 确定 。 不 
。 过 ， 数 组 一 旦 创建 出 来 就 不 能 再 改变 长 度 了 。 
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像 C 这 类 语言 也 支持 动态 内 存 管理 ， 对 象 就 是 从 堆 上 分 配 出 来 的 内 存 。 这 是 用 分 配 
和 释放 函数 手动 实现 的 ， 这 个 过 程 被 称 为 动态 内 存 管理 。 
本 章 一 开始 我 们 概述 如 何 分 配 和 释放 内 存 。 接 下 来 讲解 基本 的 分 配 国 数 ， 如 maLLoc 
和 reaLLoc， 还 会 讨论 free 函数 ， 包 括 NULL 的 使 用 和 重复 释放 这 类 问题 。 











迷途 指针 是 个 常见 问题 。 我 们 会 通过 示例 说 明 什 么 情况 下 出 现 迷途 指针 以 及 处 理 这 
种 问题 的 技术 。 最 后 一 节 讲 解 内 存 管理 的 其 他 技术 。 指 针 使 用 不 当 会 造成 不 可 预期 
的 行为 ， 这 么 说 的 意思 是 程序 可 能 产生 无 效 结果 ， 损 坏 数据 或 者 终止 程序 。 


2.1 动态 内 存 分 配 

在 C 中 动态 分 配 内 存 的 基本 步骤 有 : 

(1) 用 maLLoc 类 的 函数 分 配 内 存 ，; 

(2) 用 这 些 内 存 支持 应 用 程序 ，; 

(3) 用 free 函数 释放 内 存 。 

这 个 方法 在 具体 操作 上 可 能 存在 一 些小 变化 ， 不 过 这 里 列 出 的 是 最 常见 的 。 在 下 例 
中 ， 我 们 用 malloc 函数 为 整数 分 配 内 存 。 指 针 将 分 配 的 内 存 赋值 为 5， 然 后 内 存 
被 free 国 数 释放 。 























int *pi = (int*) malloc(sizeof(int)); 
*pi = 5; 

printf("*pi: %d\n", *pi); 

free(pi); 


当 这 段 代 码 执行 时 会 打印 数字 5。 图 2-1 说 明了 在 free 函数 执行 之 前 内 存 如 何 分 配 。 
为 方便 在 本 章 说 明 问 题 ， 除 非特 别 指出 ， 我 们 假定 示例 代码 出 现在 main 函数 中 。 

















main 500 栈 











2-1: 整数 的 内 存 分 配 


malloc 函数 的 参数 指定 要 分 配 的 字 节 数 。 如 果 成 功 ， 它 会 返回 从 堆 上 分 配 的 内 存 
的 指针 。 如 果 失 败 则 会 返回 空 指针 。 测 试 所 分 配 内 存 的 指针 是 否 有 效 在 2.2.1 市 中 
讨论 。sizeof 操作 符 使 应 用 程序 更 容易 移植 ， 还 能 确定 在 宿主 系统 中 应 该 分 配 的 
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正确 的 字 市 数 。 
在 本 例 中 ， 我 们 试图 为 整数 分 配 足 够 多 的 内 存 。 假 定 长度 是 4， 我 们 可 以 这 么 写 : 


int *pi = (int*) malloc(4); 





然而 ， 依 赖 于 系统 所 用 的 内 存 模型 ， 整 数 的 长 度 可 能 会 发 生变 化 。 可 移植 的 方法 是 
使 用 sizeof 操作 符 ， 这 样 不 管 程序 在 哪里 运行 都 会 返回 正确 的 长 度 。 


于 请 
的 涉及 解 引 操作 的 常见 错误 见 下 面 的 代码 : 
4 
te int *pi; 
全 *pi = (int*) malloc(sizeof(int)); 





问题 出 在 赋值 符号 的 左边 。 我 们 在 解 引 指 针 ， 这 样 会 把 malloc 函数 返回 
的 地 址 赋 给 pi 中 存放 的 地 址 所 在 的 内 存单 元 。 如 果 这 是 第 一 次 对 指针 进 
行 赋值 操作 ， 那 指针 所 包含 的 地 址 可 能 无 效 。 正 确 的 方法 如 下 所 示 : 


pi = (int*) malloc(sizeof(int)); 


这 种 情况 下 不 应 该 用 解 引 操作 符 。 




















稍 后 也 会 深入 讨论 free 函数 ， 它 和 malloc 协同 工作 ， 不 再 需要 内 存 时 将 其 释放 。 


:A 
， 
、 





每 次 调用 malloc (或 类 似 函 数 )， 程 序 结束 时 必须 有 对 应 的 free 函数 调 
用 ， 以 防止 内 存 泄漏 。 





一 旦 内 存 被 释放 ， 就 不 应 该 再 访问 它 了 。 通 常 我 们 不 会 在 释放 内 存 后 有 意 去 访问 ， 
不 过 ， 就 像 2.4 市 中 所 说 的 ， 这 也 有 可 能 意外 发 生 。 在 这 种 情况 下 系统 的 行为 将 依 
赖 于 实现 。 通 常 的 做 法 是 总 是 把 被 释放 的 指针 赋值 为 NULL，2.3.1 市 会 讨论 这 一 点 。 


分 配 内 存 时 ， 堆 管理 器 维护 的 数据 结构 中 会 保存 额外 的 信息 。 这 些 信 息 包括 块 大 小 
和 其 他 一 些 东 西 ， 通 常 放 在 紧 挨 着 分 配 块 的 位 置 。 如 果 应 用 程序 的 写 入 操作 超出 了 
这 块 内 存 ， 数 据 结 构 可 能 会 被 破坏 。 这 可 能 会 造成 程序 奇怪 的 行为 或 者 堆 损 坏 ， 第 
7 章 会 演示 相关 示例 。 

考虑 如 下 代码 段 ， 我 们 为 字符 串 分 配 内 存 ， 让 它 可 以 存放 最 多 5 个 字符 外 加 结尾 的 


NUL 字符 。for 循环 在 每 个 位 置 写 入 0， 但 是 没有 在 写 入 6 字 节 后 停止 。for 语句 的 
结束 条 件 是 写 入 8 字 节 。 写 入 的 0 是 二 进 制 0 而 不 是 ASCII 字符 0 的 值 。 























char *pc = (char*) malloc(6); 

for(int i=0; i<8; i++) { 
pc[il = 0; 

} 
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在 图 2-2 中 ，6 字 节 的 字符 串 后 面 还 分 配 了 额外 的 内 存 ， 这 是 堆 管理 器 用 来 记录 
内 存 分 配 的 。 如 果 我 们 越过 字符 串 的 结尾 边界 写 入 ， 额 外 的 内 存 中 的 数据 会 损坏 。 
在 本 例 中 ， 额 外 的 内 存 跟 在 字符 串 后 面 。 不 过 ， 实 际 的 位 置 和 原始 信息 取决 于 编 


译 器 。 


























图 2-2: 堆 管 理 器 用 到 的 额外 内 存 


内 存 泄漏 

如 果 不 再 使 用 已 分 配 的 内 存 却 没有 将 其 释放 就 会 发 生 内 存 泄漏 ， 导 致 内 存 泄漏 的 情 
况 可 能 如 下 : 

丢失 内 存 地 址 ; 

。 应 该 调用 free 函数 却 没 有 调用 (有 时 候 也 称 为 隐 式 泄漏 ) 。 


内 存 泄漏 的 一 个 问题 是 无 法 回收 内 存 并 重复 利用 ， 堆 管理 器 可 用 的 内 存 将 变 少 。 如 
果 内 存 不 断 地 被 分 配 并 丢失 ， 那 么 当 需 要 更 多 内 存 而 maLLoc 又 不 能 分 配 时 程序 可 
能 会 终止 ， 因 为 它 用 光 了 内 存 。 在 极端 情况 下， 操作 系统 可 能 月 潢 。 


下 面 这 个 简单 的 例子 可 以 说 明 这 个 问题 : 























char *chunk; 

while (1) { 
chunk = (char*) malloc(1000000); 
printf("Allocating\n"); 

} 


chunk 变量 指向 堆 上 的 内 存 。 然 而 ， 在 它 指 向 另 一 块 内 存 之 前 没有 释放 这 块 内 存 。 
最 终 ， 程 序 会 用 光 内 存 然后 非 正 常 终止 ， 即 使 没有 终止 ， 至 少 内 存 的 利用 效率 也 
不 高 。 

1. 丢失 地 址 


下 面 的 代码 段 说 明了 当 pi 被 赋值 为 一 个 新 地 址 时 丢失 内 存 地址 的 例子 。 当 pi 又 指 
向 第 二 次 分 配 的 内 存 时 ， 第 一 次 分 配 的 内 存 的 地 址 就 会 丢失 。 
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int *pi = (int*) malloc(sizeof(int)); 
*pi = 5; 


pi = (int*) malloc(sizeof (int)); 


图 2-3 说 明了 这 一 点 ,“ 前 ”和 “后 ”分 别 表示 在 执行 第 二 次 malloc 之 前 和 之 后 的 
程序 状态 。 由 于 没有 释放 地 址 500 处 的 内 存 ， 程 序 已 经 没有 地 方 持 有 这 个 地 址 。 








main 500 栈 














图 2-3: 丢失 地 址 
下 面 这 个 例子 是 为 字符 串 分 配 内 存 ， 将 其 初始化， 并 逐个 字符 打印 字符 串 : 


char *name = (char*)malloc(strlen("Susan")+1); 
strcpy (name, "Susan"); 
while(*name != 0) { 

printf("%c",*name); 

name++; 


} 


然而 每 次 迭代 name 都 会 增加 1， 最 后 name 会 指向 字符 串 结尾 的 NUL 字符 ， 如 图 2-4 
所 示 ， 分 配 内 存 的 起 始 地 址 丢失 了 。 








main 














图 2-4: 丢失 动态 分 配 的 内 存 的 地 址 
2. 隐 式 内 存 泄漏 


如 果 程 序 应 该 释放 内 存 而 实际 却 没 有 释放 ， 也 会 发 生 内 存 泄漏 。 如 果 我 们 不 再 需要 
某 个 对 象 但 它 仍然 保存 在 堆 上 ， 就 会 发 生 隐 式 内 存 泄 漏 ， 一 般 这 是 程序 员 名 视 所 致 。 
这 类 泄漏 的 主要 问题 是 对 象 在 使 用 的 内 存 其 实 已 经 不 需要 了 ， 应 该 归还 给 堆 。 最 差 
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的 情况 是 ， 堆 管理 器 可 能 无 法 按 需 分 配 内 存 ， 导 致 程序 不 得 不 终止 。 最 好 的 情况 是 
我 们 持 有 了 不 必要 的 内 存 。 

在 释放 用 struct 关键 字 创 建 的 结构 体 时 也 可 能 发 生 内 存 泄 漏 。 如 果 结 构 体 包含 指 
向 动态 分 配 的 内 存 的 指针 ， 那 么 可 能 需要 在 释放 结构 体 之 前 先 释放 这 些 指针 ， 第 6 
章 会 展示 示例 。 


2.2 动态 内 存 分 配 函 数 


有 几 个 内 存 分 配 函 数 可 以 用 来 管理 动态 内 存 ， 虽 然 具体 可 用 的 函数 取决 于 系统 ， 但 
大 部 分 系统 的 stdlib.h 头 文件 中 都 有 如 下 国 数 : 

















。 malloc 
。 realloc 
。 calloc 
。 free 


表 2-1 总 结 了 这 些 函 数 。 


表 2-1: 动态 内 存 分 配 函 数 

















西数 描述 
malloc 从 堆 上 分 配 内 存 

realloc 在 之 前 分 配 的 内 存 块 的 基础 上 ， 将 内 存 重 新 分 配 为 更 大 或 者 更 小 的 部 分 
calloc 从 堆 上 分 配 内 存 并 清 零 

free 将 内 存 块 返回 堆 














动态 内 存 从 堆 上 分 配 ， 至 于 一 连 串 内 存 分 配 调用 ， 系 统 不 保证 内 存 的 顺序 和 所 分 配 
内 存 的 连续 性 。 不 过 ， 分 配 的 内 存 会 根据 指针 的 数据 类 型 对 齐 ， 比 如 说 ，4 字 市 的 
整数 会 分 配 在 能 被 4 整除 的 地 址 边界 上 。 堆 管理 器 返回 的 地 址 是 最 低 字 节 的 地 址 。 




















在 图 2-3 中 ，matLtLoc 函数 在 地 址 500 处 分 配 了 4 字 节 空间 ， 第 二 次 使 用 该 函数 在 地 
址 600 处 分 配 了 内 存 。 它 们 都 处 于 4 字 节 地 址 边界 上 ， 而且 不 是 从 相 邻 的 内 存 位置 
上 分 配 的 。 








2.2.1 使 用 malloc 函 数 

malloc 函数 从 堆 上 分 配 一 块 内 存 ， 所 分 配 的 字 节 数 由 该 函数 唯一 的 参数 指定 ， 返 
回 值 是 void 指针 ， 如 果 内 存 不 足 ， 就 会 返回 NULL。 此 函数 不 会 清空 或 者 修改 内 
存 ， 所 以 我 们 认为 新 分 配 的 内 存 包 含 垃圾 数据 。 国 数 的 原型 如 下 : 
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void* malloc(size 七 ) ; 


这 个 国 数 只 有 一 个 参数 ， 类 型 是 size t， 我 们 在 第 1 章 讨论 过 此 类 型 。 传 递 参数 
给 这 个 函数 时 要 小 心 ， 因 为 如 果 参 数 是 负数 就 会 引发 问题 。 在 有 些 系统 中 ， 参 数 是 
负数 会 返回 NULL。 


如 果 malloc 的 参数 是 0， 甚 行为 是 实现 相关 的 : 可 能 返回 NULL 指针 ， 也 可 能 返回 
一 个 指向 分 配 了 0 字 节 区 域 的 指针 。 如 果 malloc 函数 的 参数 是 NULL， 那 么 一 般 会 
生成 一 个 警告 然后 返回 0 字 节 。 


以 下 是 malloc 函数 的 典型 用 法 : 
int *pi = (int*) malloc(sizeof(int)); 


执行 maLtLoc 函数 时 会 进行 以 下 操作 : 





(1) 从 堆 上 分 配 内 存 ; 
(2) 内 存 不 会 被 修改 或 是 清空 ， 
(3) 返回 首 字 闻 的 地 址 。 





赚 全 
|] 因为 当 malloc 无 法 分 配 内 存 时 会 返回 NULL， 在 使 用 它 返回 的 指针 之 前 先 
4% 4， 检查 NULL 是 不 错 的 做 法 ， 如 下 所 示 ; 

4 > 


站 
1 





int *pi = (int*) malloc(sizeof (int)); 
if(pi != NULL) { 
// 指针 没有 问题 
} else { 
// 无 效 的 指针 
} 


1. 要 不 要 强制 类 型 转换 

C 引入 void 指针 之 前 ， 在 两 种 互 不 兼容 的 指针 类 型 之 间 赋 值 需要 对 malloc 使 用 显 
式 转 换 类 型 以 避免 产生 警告 。 因 为 可 以 将 void 指针 赋值 给 其 他 任何 指针 类 型 ， 所 
以 就 不 再 需要 显 式 类 型 转换 了 。 有 些 开发 者 认为 显 式 类 型 转换 是 不 错 的 做 法 ， 因 为 : 
。 这 样 可 以 说 明 malloc 函数 的 用 意 ; 

。 代码 可 以 和 C++ (或 早期 的 C 编译 器 ) 兼容 ， 后 两 者 需要 显 式 的 类 型 转换 。 

如 果 没 有 引用 malloc 的 头 文件 ， 类 型 转换 可 能 会 有 问题 ， 编 译 器 可 能 会 产生 警告 。 
C 默认 函数 返回 整数 ， 如 果 没 有 引用 matlloc 的 原型 ， 编 译 器 会 抱怨 你 试图 把 int 
赋值 给 指针 。 
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2. 分 配 内 存 失败 


如 果 声 明了 一 个 指针 ， 但 没有 在 使 用 之 前 为 它 指向 的 地 址 分 配 内 存 ， 那 么 内 存 通 常 
会 包含 垃圾 ， 这 往往 会 导致 一 个 无 效 内 存 引用 的 错误 。 考 虑 如 下 代码 片段 : 

















int *pi; 
printf("%d\n",*pi); 


内 存 分 配 如 图 2-5 所 示 。 这 个 问题 会 在 第 7 章 详 细 讨论 。 




















图 2-5: 没有 分 配 内 存 
执行 这 段 代码 可 能 会 导致 一 个 运行 时 异常 。 字 符 串 中 这 类 问题 比较 常见 ， 如 下 所 示 : 
char *name; 


printf("Enter a name: "); 
scanf("%s",name); 


这 里 使 用 的 是 name 所 引用 的 内 存 ， 看 起 来 似乎 可 以 正确 执行 ， 实 际 上 这 块 内 存 还 
没有 分 配 。 把 图 2-5 中 的 pi 换 成 name 就 可 以 说 明 这 个 问题 。 


3. 没有 给 malloc 传 递 正确 的 参数 





malloc 函数 分 配 的 字 市 数 是 由 它 的 参数 指定 的 ， 在 用 这 个 函数 分 配 正 确 的 字 节 数 
时 要 小 心 。 比 如 说 要 为 10 个 双 精 度 浮 点 数 分 配 空间 ， 那 就 需要 80 字 节 ， 通 过 下 面 
的 代码 可 以 做 到 


double *pd = (double*)malloc(NUMBER OF DOUBLES * sizeof (double)); 


赚 六 
4 为 数据 类 型 分 配 指定 字 节 数 时 尽量 用 sizeof 操作 符 。 
4 





下 例 尝 试 为 10 个 双 精 度 浮 点 数 分 配 内 存 : 


const int NUMBER OF DOUBLES = 10; 
double *pd = (double*)malloc(NUMBER OF DOUBLES); 





这 段 代 码 实际 只 分 配 了 10 字 节 。 

4. 确认 所 分 配 的 内 存 数 

没有 标准 的 方法 可 以 知道 堆 上 分 配 的 内 存 总 数 ， 不 过 有 些 编译 器 为 此 提供 了 扩展 。 
另外 ， 也 没有 标准 的 方法 可 以 知道 堆 管理 器 分 配 的 内 存 块 大 小 。 

比如 说 ， 如 果 我 们 为 一 个 字符 串 分 配 64 字 节 ， 堆 管理 器 会 分 配额 外 的 内 存 来 管理 
这 个 块 。 所 分 配 内 存 的 总 大 小 ， 以 及 堆 管 理 器 所 用 到 的 内 存 数 ， 是 这 两 者 的 和 。 图 
2-2 对 此 有 说 明 。 

maLtLoc 可 分 配 的 最 大 内 存 是 跟 系 统 相关 的 ， 看 起 来 这 个 大 小 由 size _t 限制 。 不 过 
这 个 限制 可 能 受 可 用 的 物理 内 存 和 操作 系统 的 其 他 限制 所 影响 。 

执行 maLtLoc 时 应 该 分 配 所 请 求 数量 的 内 存 然后 返回 内 存 地 址 。 如 果 操 作 系 统 采 用 
“惰性 初始 化 ”策略 直到 访问 内 存 才 真正 分 配 的 话 会 怎样 ?这 时 候 万 一 没有 足够 的 内 
存 用 来 分 配 就 会 有 问题 ， 答 案 取 决 于 运行 时 的 操作 系统 。 开 发 者 一 般 不 需要 处 理 这 
个 问题 ， 因 为 这 种 初始 化 策略 非常 罕见 。 

5. 静态 、 全 局 指针 和 malloc 

初始 化 静态 或 全 局 变量 时 不 能 调用 函数 。 下 面 的 代码 声明 一 个 静态 变量 ， 并 试图 用 
malloc 来 初始 化 : 














static int *pi = malloc(sizeof(int)); 


这 样 会 产生 一 个 编译 时 错误 消息 ， 全 局 变量 也 一 样 。 对 于 静态 变量 ， 可 以 通过 在 后 
面 用 一 个 单独 的 语句 给 变量 分 配 内 存 来 避免 这 个 问题 。 但 是 全 局 变量 不 能 用 单独 的 
赋值 语句 ， 因 为 全 局 变量 是 在 函数 和 可 执行 代码 外 部 声明 的 ， 赋 值 语句 这 类 代码 必 
须 出 现在 函数 中 : 
































static int *pi; 
pi = malloc(sizeof (int)); 








a 在 编译 器 看 来 ， 作 为 初始 化 操作 符 的 = 和 作为 赋值 操作 符 的 = 不 一 样 。 





2.2.2 使 用 calloc 函 数 
calloc 会 在 分 配 的 同时 清空 内 存 。 该 函数 的 原型 如 下 : 


void *calloc(size t numElements, size t elementSize); 
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赚 六 


AS 清空 内 存 的 意思 是 将 其 内 容 置 为 二 进 制 0。 
~ 


calloc 国 数 会 根据 numELements 和 elementSize 两 个 参数 的 乘积 来 分 配 内 存 ， 并 
返回 一 个 指向 内 存 的 第 一 个 字 节 的 指针 。 如 果 不 能 分 配 内 存 ， 则 会 返回 NULL。 此 国 
数 最 初 用 来 辅助 分 配 数组 内 存 。 


如 果 numELements 或 elementSize 为 0， 那 么 calloc 可 能 返回 空 指针 。 如 果 
calloc 无 法 分 配 内 存 就 会 返回 空 指针 ， 而 且 全 局 变量 errno 会 设置 为 ENOMEM (内 
存 不 足 ) ， 这 是 POSIX 错误 码 ， 有 的 系统 上 可 能 没有 。 








下 例 为 pi 分 配 了 20 字 节 ， 全 部 包含 0: 
int *pi = calloc(5,sizeof (int)); 
不 用 calloc 的 话 ， 用 matLtLoc 函数 和 memset 函数 可 以 得 到 同样 的 结果 ， 如 下 所 示 : 


int *pi = malloc(5 * sizeof(int)); 
memset (pi, 0, 5S* sizeof(int)); 


汶 志 ， 

Sa memset 函数 会 用 某 个 值 填充 内 存 块 。 第 一 个 参数 是 指向 要 填充 的 缓冲 区 的 

人 AS 4 、 指 针 ， 第 二 个 参数 是 填充 缓 促 区 的 值 ， 最 后 一 个 参数 是 要 填充 的 字 节 数 。 
[SN 











如 果 内 存 需要 清 零 可 以 使 用 calloc， 不 过 执行 calloc 可 能 比 执 行 malloc 慢 。 


as cfree 函数 已 经 没 用 了 。 早 期 的 C 用 cfree 来 释放 calloc 分 配 的 内 存 。 





2.2.3 使 用 reaLLoc 函 数 
我 们 可 能 需要 时 不 时 地 增加 或 减少 为 指针 分 配 的 内 存 ， 如 果 需 要 一 个 变 长 数组 这 种 做 
法 尤其 有 用 ， 第 4 音 会 讨论 这 一 点 。reatlloc 函数 会 重新 分 配 内 存 ， 下 面 是 它 的 原型 ， 





void *realloc(void *ptr, size t size); 
realloc 函数 返回 指向 内 存 块 的 指针 。 该 函数 接受 两 个 参数 ， 第 一 个 参数 是 指 问 原 
内 存 块 的 指针 ， 第 二 个 是 请 求 的 大 小 。 重 新 分 配 的 块 大 小 和 第 一 个 参数 引用 的 块 大 
小 不 同 。 返 回 值 是 指向 重新 分 配 的 内 存 的 指针 。 


请 求 的 大 小 可 以 比 当前 分 配 的 字 节 数 小 或 者 大 。 如 果 比 当前 分 配 的 小 ， 那 么 多 余 的 
内 存 会 还 给 堆 ， 不 能 保证 多 余 的 内 存 会 被 清空 。 如 果 比 当前 分 配 的 大 ， 那 么 可 能 的 
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话 ， 就 在 紧 挨 着 当前 分 配 内 存 的 区 域 分 配 新 的 内 存 ， 否 则 就 会 在 堆 的 其 他 区 域 分 配 
并 把 旧 的 内 存 复制 到 新 区 域 。 


如 果 大 小 是 0 而 指针 非 空 ， 那 么 就 释放 内 存 。 如 果 无 法 分 配 空 间 ， 那 么 原来 的 内 存 
块 就 保持 不 变 ， 不 过 返回 的 指针 是 空 指 针 ， 且 errno 会 设置 为 ENOMEM。 
































函数 的 行为 概括 在 表 2-2 中 。 
表 2-2: realloc 函 数 的 行为 








第 一 个 参数 第 二 个 参数 行 为 

空 无 同 maLtLoc 

非 空 0 原 内 存 块 被 释放 

非 空 比 原 内 存 块 小 利用 当前 的 块 分 配 更 小 的 块 

非 空 比 原 内 存 块 大 要 么 在 当前 位 置 要 么 在 其 他 位 置 分 配 更 大 的 块 








在 下 例 中 ， 我 们 使 用 两 个 变量 为 字符 串 分 配 内 存 。 一 开始 分 配 16 字 节 ， 但 只 用 到 了 
前 面 的 13 字 节 〈12 个 十 六 进 制 数字 外 加 null 结束 字符 〈0) ) : 

char *stringl; 

char *string2; 


stringl = (char*) malloc(16); 
strcpy(stringl, "0123456789AB"); 


围 更 小 的 内 存 区 域 。 然 后 打印 这 两 个 变量 的 地 址 





接着 ， 用 realloc 国 数 指定 一 个 范 
和 内 容 : 


string2 = realloc(stringl, 8); 
printf("stringl Value: %p [%s]\n", stringl, string1); 
printf("string2 Value: %p [%s]\n", string2, string2); 


GE 


输出 如 下 : 


stringl Value: 0x500 [0123456789AB] 
string2 Value: 0x500 [0123456789AB] 


图 2-6 说 明了 内 存 如 何 分 配 。 








main 











2-6: realloc 示例 
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堆 管 理 器 可 以 重用 原始 的 内 存 块 ， 且 不 会 修改 其 内 容 。 不 过 程序 继续 使 用 的 内 存 超 
过 了 所 请 求 的 8 字 节 。 也 就 是 说 ， 我 们 没有 修改 字符 串 以 便 它 能 装 进 8 字 节 的 内 存 
块 中 。 在 本 例 中 ， 我 们 本 应 该 调整 字符 串 的 长 度 以 使 它 能 装 进 重 新 分 配 的 8 字 节 。 
实现 这 一 点 最 简单 的 办 法 是 将 NUL 赋 给 地 址 507。 实 际 使 用 的 内 存 超出 分 配 的 内 存 
不 是 个 好 做 法 ， 应 该 避免 ， 第 7 章 会 详细 讲解 这 一 点 。 


在 接 下 来 的 例子 中 ， 我 们 会 重新 分 配额 外 的 内 存 : 








stringl = (char*) malloc(16); 

strcpy(stringl, "0123456789AB"); 

string2 = realloc(stringl, 64); 

printf("stringl Value: %p [%s]\n", stringl, string1); 
printf("string2 Value: %p [%s]\n", string2, string2); 


执行 以 上 代码 得 到 类 似 下 面 的 结果 : 


stringl Value: 0x500 [0123456789AB] 
string2 Value: 0x600 [0123456789AB] 


在 本 例 中 ，realloc 必须 分 配 一 个 新 的 内 存 块 。 图 2-7 说 明了 内 存 的 分 配 。 
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2-7: 分 配额 外 内 存 


2.2.4 alloca 函 数 和 变 长 数组 

alloca 函数 (微软 为 matloca) 在 函数 的 栈 帧 上 分 配 内 存 。 函 数 返 回 后 会 自动 释 
放 内 存 。 若 底层 的 运行 时 系统 不 基于 栈 ，alloca 函数 会 很 难 实现 ， 所 以 这 个 函数 
是 不 标准 的 ， 如 果 应 用 程序 需要 可 移植 就 尽量 避免 使 用 它 。 

C99 引入 了 变 长 数组 (VLA)， 人 允许 函数 内 部 声明 和 创建 其 长 度 由 变量 决定 的 数组 。 
在 下 例 中 ， 我 们 分 配 了 一 个 在 函数 内 使 用 的 char 数组 : 














void compute(int size) { 
char* buffer[sizel]; 








这 意味 着 内 存 分 配 在 运行 时 完成 ， 且 将 内 存 作为 栈 帧 的 一 部 分 来 分 配 。 另 外 ， 如 果 
数组 用 到 sizeof 操作 符 ， 也 是 在 运行 时 而 不 是 编译 时 执行 。 
这 么 做 只 会 有 一 点 小 小 的 运行 时 开销 。 而 且 一 旦 函数 退出 ， 立 即 释 放 内 存 。 因 为 


我 们 没有 用 malloc 这 类 函数 来 创建 数组 ， 所 以 不 应 该 用 free 函数 来 释放 它 
alloca 函数 也 不 应 该 返回 指向 数组 所 在 内 存 的 指针 ， 这 个 问题 在 第 5 章 解 决 。 

















VLA 的 长 度 不 能 改变 ， 一 经 分 配 其 长 度 就 固定 了 。 如 果 你 需要 一 个 长 度 能 
人 4 ， 够 实际 变化 的 数组 ， 那 么 需要 使 用 类 似 reatloc 的 函数 ，2.2.3 节 讨 论 的 
全， 正 是 这 种 方法 。 











2.3 ”用 free 函 数 释 放 内 存 


有 了 动态 内 存 分 配 ， 程 序 员 可 以 将 不 再 使 用 的 内 存 返 还 给 系统 ， 这 样 可 以 释放 内 在 
留 作 他 用 。 通 常用 free 函数 实现 这 一 点 ， 该 函 数 的 原型 如 下 ， 


void free(void *ptr); 


指针 参数 应 该 指向 由 malloc 类 函数 分 配 的 内 存 的 地 址 ， 这 块 内 存 会 被 返还 给 堆 。 
尽管 指针 仍然 指向 这 块 区 域 ， 但 是 我 们 应 该 将 它 看 成 指向 垃圾 数据 。 稍 后 可 能 重新 
分 配 这 块 区 域 ， 并 将 其 装 进 不 同 的 数据 。 


在 下 面 这 个 简单 的 例子 中 ，pi 指向 分 配 的 内 存 ， 这 块 内 存 最 终 会 被 释放 : 








int *pi = (int*) malloc(sizeof(int)); 
freetpi), 
图 2-8 说 明了 free 函数 执行 前 后 瞬间 内 存 的 分 配 情况 。 地 址 500 处 的 虚线 框 表示 


NE 但 仍然 有 可 能 包含 原 值 ，pi 变量 仍然 指向 地 址 500。 这 种 情况 称 为 
迷途 指针 ， 会 在 2.4 节 详 细 讨 论 。 








500 


main 500 栈 main 





释放 之 前 


2-8: 用 free 释放 内 存 
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如 果 传递 给 free 函数 的 参数 是 空 指针 ， 通 常 它 什么 都 不 做 。 如 果 传 入 的 指针 所 指 
向 的 内 存 不 是 由 maLLoc 类 的 函数 分 配 ， 那 么 该 函数 的 行为 将 是 未 定义 的 。 在 下 例 
中 ， 分 配给 pi 的 是 num 的 地 址 ， 不 过 这 不 是 一 个 合法 的 堆 地 址 : 





int num; 
int *pi = &num; 
free(pi);  // 未 定义 行为 





| 应 该 在 同一 层 管理 内 存 的 分 配 和 释放 。 比 如 说 ， 如 果 古 在 函数 内 分 配 内 存 ， 
人心 4 ， 那 么 就 应 该 在 同一 个 函数 内 释放 它 。 

















2.3.1 将 已 释放 的 指针 赋值 为 NULL 

已 释放 的 指针 仍然 可 能 造成 问题 。 如 果 我 们 试图 解 引 一 个 已 释放 的 指针 ， 其 行为 将 
是 未 定义 的 。 所 以 有 些 程序 员 会 显 式 地 给 指针 赋 NULL 来 表示 该 指针 无 效 ， 后 续 再 
使 用 这 种 指针 会 造成 运行 时 异常 。 

下 面 是 该 方法 的 示例 : 














int *pi = (int*) malloc(sizeof(int)); 


free(pi); 
pi = NULL; 


内 存 分 配 如 图 2-9 所 示 。 








main 














2-9: 调用 free 后 给 指针 赋值 NULL 


这 种 技术 的 目的 是 解决 迷途 指针 类 问题 。 不 过 ， 花 时 间 处 理 造 成 这 类 问题 的 条 件 
要 比 粗暴 地 用 空 指针 一 刀 切 好 ， 更 何况 除了 初始 化 的 情况 ， 都 不 能 将 NULL 赋 给 
指针 。 


2.3.2 ”重复 释放 
重复 释放 是 指 两 次 释放 同一 块 内存 。 下 面 是 一 个 简单 的 例子 
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int *pi = (int*) maLLoc(Sizeof(int) ) 
*pi = 5; 
free(pi); 


free(pi); 
调用 第 二 个 free 函数 会 导致 运行 时 异常 。 另 一 个 例子 不 那么 明显 ， 涉 及 指向 同一 
块 内 存 的 两 个 指针 。 如 下 所 示 ， 如 果 我 们 试图 第 二 次 释放 同一 块 内 存 会 发 生 同 样 的 
运行 时 异常。 





int *pl = (int*) malloc(sizeof(int)); 
int *p2 = p1; 

free(p1); 

free(p2); 


内 存 分 配 如 图 2-10 所 示 。 























main 
第 一 次 释放 之 前 第 一 次 释放 之 后 
图 2-10: 重复 释放 
加 
人 Rs 」 两 个 指针 引用 同一 个 地 址 称 为 别名 ， 这 个 概念 将 在 第 8 章 讨论 ， 
a 





不 幸 的 是 ， 堆 管理 器 很 难 判断 一 个 块 是 否 已 经 被 释放 ， 因 此 它们 不 会 试图 去 检测 是 
否 两 次 释放 了 同一 块 内 存 。 这 通常 会 导致 堆 损坏 和 程序 终止 ， 即 使 程序 没有 终止， 
它 意 味 着 程序 逻辑 可 能 存在 问题 ， 同 一 块 内 存 没有 理由 释放 两 次 。 

有 人 建议 free 函数 应 该 在 返回 时 将 NULL 或 其 他 某 个 特殊 值 赋 给 自身 的 参数 。 但 指针 
是 传 值 的 ， 因 此 free 国 数 无 法 显 式 地 给 它 赋值 NULL，3.2.7 节 会 详细 讨论 这 个 问题 。 


2.3.3” 堆 和 系统 内 存 
堆 一 般 利 用 操作 系统 的 功能 来 管理 内 存 。 堆 的 大 小 可 能 在 程序 创建 后 就 固定 不 变 了 ， 
也 可 能 可 以 增长 。 不 过 堆 管 理 器 不 一 定 会 在 调用 free 函数 时 将 内 存 返 还 给 操作 系 
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统 。 释 放 的 内 存 只 是 可 供应 用 程序 后 续 使 用 。 所 以 ， 如 果 程 序 先 分 配 内 存 然后 释放 ， 
从 操作 系统 的 角度 看 ， 释 放 的 内 存 通 常 不 会 反映 在 应 用 程序 的 内 存 使 用 上 。 


2.3.4 程序 结束 前 释放 内 存 

操作 系统 负责 维护 应 用 程序 的 资源 ， 包 括 内 存 。 当 应 用 程序 终止 时 ， 操 作 系统 要 负 
责 重新 分 配 这 块 内 存 以 便 别 的 应 用 程序 使 用 。 已 终止 的 应 用 程序 的 内 存 状态 不 管 是 
否 损 坏 都 无 关 紧 要 ， 事 实 上 ， 内 存 损坏 可 能 正 是 应 用 程序 终止 的 原因 。 异 常 终止 的 
程序 可 能 无 法 做 清理 工作 ， 因 此 没有 理由 在 程序 终止 之 前 释放 分 配 的 内 存 。 


话 虽 如 此 ， 可 能 又 有 一 些 原 因 要 求 我 们 在 程序 终止 前 释放 内 存 。 尽 责 的 程序 员 可 能 
会 把 释放 内 存 当 成 质量 指标 。 即 使 应 用 程序 正在 终止 ， 不 再 使 用 内 存 后 将 其 释放 总 
归 是 好 习惯 。 如 果 用 工具 来 检测 内 存 泄 漏 或 是 类 似 问 题 ， 那 么 释放 内 存 会 让 这 类 工 
有 具 的 输出 是 干净 的 。 在 有 些 相 对 简单 的 操作 系统 上 ， 操 作 系 统 本 身 可 能 不 会 自动 回 
收 内 存 ， 而 是 需要 程序 在 终止 前 回收 内 存 。 还 有 ， 新 版 的 应 用 程序 可 能 会 在 程序 末 
尾 增 加 代码 ， 如 果 之 前 的 内 存 没 有 释放 就 可 能 出 问题 。 


因此 ， 确 保 程序 终止 前 释放 所 有 内 存 : 


。 可 能 得 不 偿 失 ， 

可 能 很 耗 时 ， 释 放 复 杂 结 构 也 比较 麻烦 ; 
可 能 增加 应 用 程序 大 小 ; 

。 导致 更 长 的 运行 时 间 ， 

。 增加 引入 更 多 编程 错误 的 概率 。 


是 否 要 在 程序 终止 前 释放 内 存 取决 于 具体 的 应 用 程序 。 


2.4 迷途 指针 
如 果 内 存 已 经 释放 ， 而 指针 还 在 引用 原始 内 存 ， 这 样 的 指针 就 称 为 迷途 指针 。 迷 途 
指针 没有 指向 有 效 对 象 ， 有 时 候 也 称 为 过 早 释放 。 


使 用 迷途 指针 会 造成 一 系列 问题 ， 包 括 : 


。 如 果 访 问 内 存 ， 则 行为 不 可 预期 ， 
。 如 果 内 存 不 可 访问 ， 则 是 段 错误 ; 
。 潜在 的 安全 隐患 。 


导致 这 几 类 问题 的 情况 可 能 如 下 : 
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。 访问 已 释放 的 内 存 ; 
。 返回 的 指针 指向 的 是 上 次 函数 调用 中 的 自动 变量 (在 3.2.5 市 中 会 讨论 )。 





2.4.1 迷途 指针 示例 


在 下 面 这 个 简单 的 例子 中 我 们 用 maLtLoc 函数 为 一 个 整数 分 配 内 存 ， 接 下 来 ， 用 
free 函数 释放 内 存 : 


int *pi = (int*) malloc(sizeof(int)); 
*pi = 5; 

printf("*pi: %d\n", *pi); 

free(pi); 


pi 变量 持 有 整数 的 地 址 ， 但 堆 管 理 器 可 以 重复 利用 这 块 内 存 ， 且 其 中 存放 的 可 能 
是 非 整 数 数据 。 图 2-11 说 明了 free 函数 执行 前 后 的 程序 状态 。 假 设 pi 变量 属于 
main 函数 ， 位 于 地 址 100，matLtLoc 函数 分 配 的 内 存 位 于 地 址 500。 





500 


main 500 栈 main 


释放 前 














2-11: 迷途 指针 


执行 free 函数 将 释放 地 址 500 处 的 内 存 ， 此 后 就 不 应 该 再 使 用 这 块 内 存 了 。 但 大 
部 分 运行 时 系统 不 会 阻止 后 续 的 访问 或 修改 。 我 们 还 是 可 以 向 这 个 位 置 写 人 数据 ， 
如 下 所 示 。 这 么 做 的 结果 是 不 可 预期 的 ，。 




















free(pi); 

Di TO 
还 有 一 种 迷途 指针 的 情况 更 难 觉察 : 一 个 以 上 的 指针 引用 同一 内 存 区 域 而 其 中 一 个 
指针 被 释放 。 如 下 所 示 ，p1 和 p2 都 引用 同一 块 内 存 区 域 〈 称 为 指针 别名 ) ， 不 过 

pl 被 释放 了 : 








int *pl = (int*) malloc(sizeof(int)); 
*pl = 5; 


free(p1); 
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*p2 = 10; ”// 迷途 指针 


图 2-12 说 明了 内 存 分 配 情况 ， 虚 线 框 表示 释放 的 内 存 。 








main 











图 2-12 ”迷途 指针 和 指针 别名 

使 用 块 语句 时 也 可 能 出 现 一 些小 问题 ， 如 下 所 示 。 这 里 pi 被 赋值 为 tmp 的 地 址 ， 
变量 pi 可 能 是 全 局 变量 ， 也 可 能 是 局 部 变量 。 不 过 当 包 含 tmp 的 块 出 栈 之 后 ， 地 
址 就 不 再 有 效 : 











int *pi; 
{ 
int tmp = 5; 
pi = &tmp; 
// 这 里 pi 变 成 了 迷途 指针 
foo(); 





大 部 分 编译 器 都 把 块 语句 当做 一 个 栈 帧 。tmp 变量 分 配 在 栈 帧 上 ， 之 后 在 块 语句 退 
出 时 会 出 栈 。pi 指针 现在 指向 一 块 最 终 可 能 被 其 他 活跃 记录 (比如 foo 函数 ) 覆盖 
的 内 存 区 域 。 图 2-13 说 明 的 就 是 这 种 情形 。 














| mp CE foo 到 





块 语句 退出 前 块 语句 退出 后 








图 2-13: 块 语句 的 问题 


2.4.2 ”处 理 迷途 指针 
有 时 候 调 试 指 针 诱 发 的 问题 会 很 难 解决 ， 以 下 方法 可 用 来 对 付 迷 途 指 针 。 
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。 释放 指针 后 置 为 NULL， 后 续 使 用 这 个 指针 会 终止 应 用 程序 。 不 过 ， 如 果 存 在 多 
个 指针 的 话 还 是 会 有 问题 。 因 为 赋值 只 会 影响 一 个 指针 ，2.3.2 节 中 有 相关 说 明 。 

。 写 一 个 特殊 的 函数 代替 free 函数 (参见 3.2.7 节 )。 

。 有 些 系 统 (运行 时 或 调试 系统 ) 会 在 释放 后 覆 写 数据 (比如 0xDEADBEEF， 取 
决 于 被 释放 的 对 象 ，Visual Studio 会 用 0xCC、0xCD 或 者 0xDD)。 在 不 抛 出 异 
常 的 情况 下 ， 如 果 程 序 员 在 预期 之 外 的 地 方 看 到 这 些 值 ， 可 以 认为 程序 可 能 在 访 
问 已 释放 的 内 存 。 

。 用 第 三 方 工具 检测 迷途 指针 和 其 他 问题 。 


在 调试 迷途 指针 时 打印 指针 的 值 可 能 会 有 所 帮助 ， 但 需要 注意 打印 的 方式 。1.1.5 节 
已 经 讨论 过 如 何 打印 指针 的 值 。 确 保 用 一 致 的 方式 打印 ， 从 而 避免 比较 指针 的 值 时 
产生 歧义 。assert 宏 也 可 能 有 用 ，7.1.3 节 中 会 讲 到 。 


2.4.3 ”调试 器 对 检测 内 存 泄漏 的 支持 
微软 提供 了 解决 动态 分 配 内 存 的 覆 写 和 内 存 泄漏 的 技术 。 这 种 方法 在 调试 版 程序 里 
用 了 特殊 的 内 存 管理 技术 : 


。 检查 堆 的 完整 性 ， 
。 检查 内 存 泄漏 ， 
。 模拟 堆 内 存 不 够 的 情况 。 


微软 是 通过 使 用 一 种 特殊 的 数据 结构 管理 内 存 分 配 来 做 到 这 一 点 的 。 这 种 结构 维 
护 调试 信息 ， 比 如 malloc 调用 点 的 文件 名 和 行 号 ， 还 会 在 实际 的 内 存 分 配 之 前 
和 之 后 分 配 缓冲 区 来 检测 对 实际 内 存 的 履 写 。 关 于 这 种 技术 的 更 多 信息 可 以 参 芳 


Microsoft Developer Network (http://msdn.microsoft.com/en-us/library/x98tx3cf.aspx )。 














Mudflap 库 (http://gcc.fyxm.net/summit/2003/mudflap.pdf) 为 GCC 编译 器 提供 了 类 
似 的 功能 ， 它 的 运行 时 库 支 持 对 内 存 雇 漏 的 检测 和 其 他 功能 ， 这 种 检测 是 通过 监控 
指针 解 引 操作 来 实现 的 。 


2.5 动态 内 存 分 配 技术 
目前 为 止 ， 我 们 已 经 讨论 了 如 何 使 用 堆 管 理 器 分 配 和 释放 内 存 。 不 过 ， 不 同 的 编译 
器 在 技术 实现 上 有 所 不 同 。 大 部 分 堆 管 理 器 把 堆 或 数据 段 作 为 内 存 资源 。 这 种 方法 
的 缺点 是 会 造成 碎片 ， 而 且 可 能 和 程序 栈 碰撞 。 尽 管 如 此 ， 它 还 是 实现 堆 最 常用 的 
方法 。 

堆 管 理 器 需要 处 理 很 多 问题 ， 比 如 堆 是 否 基于 进程 和 (或 






































wa 


线程 分 配 ， 如 何 保护 堆 

















C 的 动态 内 存 管 理 | 49 


不 受 安全 攻击 。 


堆 管 理 器 有 不 少 ， 包 括 OpenBSD 的 malloc、Hoard 的 malloc 和 Google 开发 的 
TCMalloc。GNU C 库 的 分 配器 基于 通用 分 配器 dlmalloc (http://dmalloc.com)， 它 
提供 调试 机 制 ， 能 追踪 内 存 浴 漏 。dlmalloc 的 日 志 特 性 可 以 追踪 内 存 的 使 用 和 内 存 
事务 ， 还 有 一 些 其 他 功能 。 


6.3 节 会 讲 到 手动 管理 结构 体内 存 的 技术 。 





2.5.1 C 的 垃圾 回收 

malloc 和 free 函数 提供 了 手动 分 配 和 释放 内 存 的 方法 。 不 过 对 于 很 多 问题 ， 需 要 
考虑 使 用 C 的 手动 内 存 管理 ， 比 如 性 能 、 达 到 好 的 引用 局 部 性 、 线 程 问题 ， 以 及 优 
雅 地 清理 内 存 。 

有 些 非 标准 的 技术 可 以 用 来 解决 部 分 问题 ， 本 节 将 探讨 其 中 一 部 分 技术 。 这 些 技术 
的 关键 特性 在 于 自动 释放 内 存 。 内 存 不 再 使 用 之 后 会 被 收集 起 来 以 备 后 续 使 用 ， 释 
放 的 内 存 称 为 垃圾 ， 因 此 ， 垃 圾 回收 就 是 指 这 个 过 程 。 

鉴于 以 下 原因 ， 垃 圾 回收 是 有 价值 的 : 


。 不 需要 程序 员 费 尽心 思 决 定 何 时 释放 内 在， 
。 让 程序 员 专 注 应 用 程序 本 身 的 问题 。 











Boehm-Weiser Collector (http://www.hpl.hp.com/personal/Hans_Boehm/gc/) 可 以 作 
为 手动 内 存 管理 的 替换 方法 ， 不 过 它 不 属于 语言 的 一 部 分 。 











2.5.2 ”资源 获取 即 初始 化 

资源 获取 即 初始 化 (Resource Acquisition Is Initialization，RAII) 是 Bjarne Stroustrup 
发 明 的 技术 ， 可 以 用 来 解决 C++ 中 资源 的 分 配 和 释放 。 即 使 有 异常 发 生 ， 这 种 技术 
也 能 保证 资源 的 初始 化 和 后 续 的 释放 。 分 配 的 资源 最 终 总 是 会 得 到 释放 。 

有 好 儿 种 方法 可 以 在 C 中 使 用 RAI。GNU 编译 器 提供 了 非 标准 的 扩展 来 支持 这 个 
特性 ， 通 过 演示 如 何在 一 个 函数 中 分 配 内 存 然 后 释放 可 以 说 明 这 种 扩展 。 一 旦 变量 
超出 作用 域 会 自动 触发 释放 过 程 。 

GNU 的 扩展 要 用 到 RAII VARIABLE 宏 ， 它 声明 一 个 变量 ， 然 后 给 变量 关联 如 下 
属性 : 


站 一 个 类 型 ， 
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创建 变量 时 执行 的 函数 ， 
。 变量 超出 作用 域 时 执行 的 函数 。 


这 个 宏 如 下 所 示 : 





#define RAIT VARIABLE(vartype,varname,initval,dtor) \ 
void dtor ## varname (vartype * V) { dtor(*Vv); } \ 


vartype varname attribute ((cleanup( dtor ## varname))) = 





(initval) 


在 下 例 中 ， 我 们 将 name 变量 声明 为 字符 指针 。 创 建 它 时 会 执行 malloc 函数 ， 为 
其 分 配 32 字 节 。 当 函数 结束 时 ，name 超出 作用 域 就 会 执行 free 函数 : 


void raiiEfxample() { 
RAIIT VARIABLE(char*, name, (char*)malloc(32), free); 
strcpy(name, "RAIT Example"); 
printf("%s\n",name); 


} 


函数 执行 后 会 打印 "RAII Example" 字符 串 。 


不 用 GNU 扩展 也 可 以 达到 类 似 的 效果 (http://en.wikipedia.org/wiki/Resource_ 


Acquisition_Is_ Initialization#Ad-hoc_mechanisms ) 。 


2.5.3 ”使 用 异常 处 理 函 炎 


另 一 种 处 理 内 存 释 放 的 方法 是 利用 异常 处 理 (http://www.adomas.org/excc/)。 尽 管 
异常 处 理 不 属于 标准 C， 但 如 果 可 以 使 用 它 且 不 考虑 移植 问题 ， 它 








说 明 利 用 Microsoft Visual Studio 版 的 C 语言 的 方法 。 








已 


会 很 有 用 。 下 面 


这 里 的 try 块 包含 任何 可 能 在 运行 时 抛 出 异常 的 语句 。 不 管 有 没有 异常 抛 出 ， 都 会 


执行 finally 块 ， 因 此 也 一 定 会 执行 free 函数 。 


void exceptionExample() { 
int *pi = NULL; 
athy{ 
pi = (int*)malloc(sizeof(int)); 
*pi = 5; 
printf("%d\n",*pi); 
} 
__finally { 
free(pi); 
} 
} 


也 可 以 用 别 的 方法 在 C 中 实现 异常 处 理 。 
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2.6 小结 

动态 内 存 分 配 是 C 语言 的 重要 特性 。 本 章 主 要 关注 用 malloc 和 free 函数 实现 手 
动 分 配 内 存 。 我 们 解决 了 涉及 这 两 个 函数 的 一 系列 常见 问题 ， 包 括 内 存 分 配 失 败 和 
迷途 指针 。 

此 外 ， 还 有 一 些 非 标准 技术 可 用 来 实现 C 的 动态 内 存 管 理 。 我 们 也 接触 了 几 种 垃圾 
回收 技术 ， 包 括 RAI 和 异常 处 理 。 
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第 3 章 


指针 和 冰 数 





指针 对 函数 功能 的 贡献 极 大 。 它 们 能 够 将 数据 传递 给 函数 ， 并 且 人 允许 函数 对 数据 进 
行 修改 。 我 们 可 以 将 复杂 数据 用 结构 体 指针 的 形式 传递 给 函数 和 从 函数 返回 。 如 果 
指针 持 有 函数 的 地 址 ， 就 能 动态 控制 程序 的 执行 流 。 在 本 章 中 ， 我 们 会 探索 指针 与 
函数 结合 使 用 的 能 力 ， 学 习 如 何 用 指针 解决 很 多 真实 存在 的 问题 。 

要 理解 函数 及 其 和 指针 的 结合 使 用 ， 需 要 理解 程序 栈 。 大 部 分 现代 的 块 结构 语言 ， 
比如 C， 都 用 到 了 程序 栈 来 支持 函数 执行 。 调 用 函数 时 ， 会 创建 函数 的 栈 帧 并 将 寺 
推 到 程序 栈 上 。 国 数 返回 时 ， 其 栈 帧 从 程序 栈 上 弹出 。 

在 使 用 函数 时 ， 有 两 种 情况 指针 很 有 用 。 首 先是 将 指针 传递 给 函数 ， 这 时 函数 可 以 
修改 指针 所 引用 的 数据 ， 也 可 以 更 高 效 地 传递 大 块 信息 。 

男 一 种 情况 是 声明 函数 指针 。 本 质 上 ， 函 数 表 示 法 就 是 指针 表示 法 。 函 数 名 字 经 过 
求 值 会 变 成 函数 的 地 址 ， 然 后 函数 参数 会 被 传递 给 函数 。 我 们 将 会 看 到 ， 函 数 指针 
为 控制 程序 的 执行 流 提 供 了 新 的 选择 。 

下 面 这 一 市 将 为 理解 和 使 用 函数 以 及 指针 打 好 基础 。 鉴 于 函数 和 指针 的 普及 程度 ， 
有 这 个 基础 会 对 你 有 很 大 帮助 。 


3.1 程序 的 栈 和 堆 


程序 的 栈 和 堆 是 C 重要 的 运行 时 元 素 。 在 本 节 中 ， 我 们 将 仔细 研究 程序 栈 和 堆 的 结 
构 以 及 用 法 ， 还 会 看 一 下 栈 帧 的 结构 ， 它 用 于 保存 局 部 变量 。 














全 





53 





， 它 们 总 是 分 配 在 栈 帧 上 。 











3.1.1 程序 栈 
程序 栈 是 支持 国 数 执行 的 内 存 区 域 ， 通 常 和 堆 共 享 。 也 就 是 说 ， 它 们 共享 同一 块 内 
存 区 域 。 程 序 栈 通 常 占据 这 块 区 域 的 下 部 ， 而 堆 用 的 则 是 上 部 。 
































程序 栈 存 放 栈 帧 (stack frame) ， 栈 帧 有 时 候 也 称 为 活跃 记录 (activation record) 或 
活跃 帧 (activation frame) 。 栈 帧 存放 国 数 参数 和 局 部 变量 。 堆 管理 动态 内 存 ， 已 经 
在 2.1 节 中 讨论 过 了 。 





3-1 从 原理 上 说 明了 栈 和 扒 的 结构 。 这 个 说 明基 于 以 下 代码 片段 。 


void function2() { 

Object *varl = ...; 

int var2; 

printf("Program Stack Example\n"); 
} 


void function1() { 
Object *var3 = ...; 


function2(); 
} 
int main() { 
int var4; 
function1(); 




















邮 


调用 函数 时 ， 函 数 的 栈 帧 被 推 到 栈 上 ， 栈 向 上 “长 出 ”一 个 栈 巾 。 当 函数 终止 时 ， 
其 栈 帧 从 程序 栈 上 弹出 。 栈 帧 所 使 用 的 内 存 不 会 被 清理 ,但 最 终 可 能 会 被 推 到 程序 
栈 上 的 另 一 个 栈 帧 覆盖 。 


动态 分 配 的 内 存 来 自 堆 ， 堆 向 下 “生长 ”。 随 着 内 存 的 分 配 和 释放 ， 堆 中 会 布 满 碎 
片 。 尽 管 堆 是 向 下 生长 的 ， 但 这 只 是 个 大 体 方向 ， 实 际 上 内 存 可 能 在 堆 上 的 任意 位 
置 分 配 。 


3.1.2” 栈 帧 的 组 织 
栈 帧 由 以 下 几 种 元 素 组 成 。 


























返回 地 址 
国 数 完成 后 要 返回 的 程序 内 部 地 址 。 
局 部 数据 存储 

为 局 部 变量 分 配 的 内 存 。 
。 参数 存储 
为 函数 参数 分 配 的 内 存 。 
栈 指针 和 基 指 针 
运行 时 系统 用 来 管理 栈 的 指针 。 
普通 C 程序 员 不 会 甘心 支持 栈 帧 的 栈 指针 和 基 指 针 。 不 过 ， 理 解 它们 的 概念 和 用 法 
能 让 你 更 深入 地 理解 程序 栈 。 
栈 指针 通常 指 向 栈 顶 部 。 基 指针 ( 帧 指针 ) 通常 存在 并 指向 栈 帧 内 部 的 地 址 ， 比 如 
返回 地 址 ， 用 来 协助 访问 栈 帧 内 部 的 元 素 。 这 两 个 指针 都 不 是 C 指针 ， 它 们 是 运行 
时 系统 管理 程序 栈 的 地 址 。 如 果 运 行 时 系统 用 C 实现 ， 这 些 指针 倒 真 是 C 指针 。 
我 们 以 下 面 这 个 函数 为 例 来 了 解 栈 帧 的 创建 。 该 函数 传递 了 一 个 整数 数组 和 一 个 表 
示 数 组 长 度 的 整数 。 三 个 printf 语句 用 来 打印 参数 和 局 部 变量 的 地 址 : 





























float average(int *arr, int size) { 
int sum; 
printf("arr: %p\n",&arr); 
printf("size: %p\n",&size); 
printf("sum: %p\n",&sum); 


for(int i=0; i<size; i++) { 
sum += arr[i]， 
} 


return (sum * 1.0f) / size; 
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执行 上 述 代 码 会 得 到 类 似 下 面 的 输出 : 


arr: Ox500 
size: OQx504 
sum: 0x480 





参数 地 址 和 局 部 变量 地 址 之 间 的 空 档 ， 保 存 的 是 运行 时 系统 管理 栈 所 需要 的 其 他 栈 
帧 元 素 。 


系统 在 创建 栈 帧 时 ， 将 参数 以 跟 声 明 时 相反 的 顺序 推 到 帧 上 ， 最 后 推 入 局 部 变量 ， 
如 图 3-2 所 示 。 在 这 个 例子 中 ，size 在 arr 之 前 被 推 人 。 通 常 ， 接 下 来 会 推 人 国 数 
调用 的 返回 地 址 ， 然 后 是 局 部 变量 。 推 和 它们 的 顺序 跟 其 在 代码 中 列 出 的 顺序 相反 。 




















sm480[ |] 人 





Return Address 
average Ed 
rs | | 
szes04[ |] 
main 














图 3-2: 栈 帧 示例 


从 原理 上 说 ， 本 例 中 的 栈 “ 向 上 ”生长 。 不 过 栈 帧 的 参数 和 局 部 变量 以 及 新 栈 帧 被 
添加 到 了 低 内 存 地 址 。 栈 的 实际 生长 方向 跟 实 现 相 关 。 


for 语句 中 用 到 的 变量 i 没有 包含 在 栈 帧 中 。C 把 块 语句 当做 “微型 ”函数 ， 会 在 


合适 的 时 机 将 其 推 人 栈 和 从 栈 中 弹出 。 在 本 例 中 ， 块 语句 在 执行 时 被 推 到 程序 栈 中 
average 栈 帧 上 面 ， 执 行 完 后 又 弹出 。 





精确 的 地 址 可 能 会 变化 ， 不 过 顺序 一 般 不 变 。 这 一 点 很 重要 ， 因 为 它 可 以 解释 参数 
和 变量 内 存 分 配 的 相对 顺序 。 在 调试 指针 问题 时 这 一 点 会 很 有 用 。 如 果 你 不 知道 栈 
帧 如 何 分 配 ， 这 些 地 址 在 你 看 来 也 毫 无 意义 。 





将 栈 帧 推 到 程序 栈 上 时 ， 系 统 可 能 会 耗 尽 内 存 ， 这 种 情况 称 为 栈 游 出， 通常 会 导致 
程序 非 正 常 终止 。 要 牢记 每 个 线程 通常 都 会 有 自己 的 程序 栈 。 一 个 或 多 个 线程 访问 
内 存 中 的 同一 个 对 象 可 能 会 导致 冲突 ， 我 们 将 在 8.3.1 节 中 讨论 这 个 问题 。 
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3.2 通过 指针 传递 和 返回 数据 

本 节 讨 论 将 指针 传递 给 函数 和 从 函数 返回 指针 。 传 递 指 针 可 以 让 多 个 函数 访问 指针 
所 引用 的 对 象 ， 而 不 用 把 对 象 声 明 为 全 局 可 访问 。 这 意味 着 只 有 需要 访问 这 个 对 象 
的 函数 才 有 访问 权限 ， 而 且 也 不 需要 复制 对 象 。 


要 在 某 个 函数 中 修改 数据 ， 需 要 用 指针 传递 数据 。 通 过 传递 一 个 指向 常量 的 指针 ， 
可 以 使 用 指针 传递 数据 并 禁止 其 被 修改 ， 正 如 3.2.3 节 中 所 展示 的 那样 。 当 数据 是 
需要 被 修改 的 指针 时 ， 我 们 就 传递 指针 的 指针 ， 这 个 话题 在 3.2.7 市 中 讨论 。 


传递 参数 〈 包 括 指针 ) 时 ， 传 递 的 是 它们 的 值 。 也 就 是 说 ， 传 递 给 函数 的 是 参数 值 
的 一 个 副本 。 当 涉及 大 型 数据 结构 时 ， 传 递 参 数 的 指针 会 更 高 效 。 比 如 说 一 个 表示 
雇员 的 大 型 结构 体 ， 如 果 我 们 把 整个 结构 体 传递 给 函数 ， 那 么 需要 复制 结构 体 的 所 
有 字 节 ， 这 样 会 导致 程序 运行 变 慢 ， 栈 帧 也 会 占用 过 多 内 存 。 传 递 对 象 的 指针 意味 
着 不 需要 复制 对 象 ， 但 可 以 通过 指针 访问 对 象 。 


3.2.1 用 指针 传递 数据 

用 指针 来 传递 数据 的 一 个 主要 原因 是 国 数 可 以 修改 数据 。 下 面 的 代码 段 实现 了 一 个 
交换 函数 ， 可 以 交换 其 参数 所 引用 的 值 。 这 是 很 多 排序 算法 中 的 常用 操作 。 我 们 在 
这 里 用 整数 指针 ， 通 过 解 引 它们 来 实现 交换 。 


























void swapWithPointers(int* pnuml, int* pnum2) { 
int tmp; 
tmp = *pnuml; 
*pnuml = *pnum2; 
*pnum2 = tmp; 


} 
下 面 的 代码 段 说 明了 这 个 函数 的 用 法 : 


int main() { 
int nl = 5; 
int: n2; 三 10° 
swapWithPointers(&n1, &n2); 
return 0; 


} 
指针 pnuml 和 pnum2 在 交换 操作 中 被 解 引 ， 结 果 是 修改 了 nl 和 n2 的 值 。 图 3-3 


说 明了 内 存 如 何 组 织 ， 左 图 表示 swap 函数 开始 时 程序 栈 的 状态 ， 而 右 图 则 是 函数 
返回 前 的 状态 。 
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pnum1488 pnum1 488 
4 


0 
pnum2 492 pnum2 492 


swap 


n1 500 n1 500 


main 








交换 之 前 的 程序 栈 





图 3-3: 用 指针 实现 交换 


3.2.2 用 值 传递 数据 
如 果 不 通过 指针 传递 参数 ， 那 么 交换 就 不 会 发 生 。 下 面 的 函数 通过 值 来 传递 两 个 整数 : 


void swap(int numl, int num2) { 
int tmp; 
tmp = numl; 
numl num2 ; 
num2 tmp; 




















} 
下 面 的 代码 将 两 个 整数 传递 给 函数 : 


int main() { 
int nl 
int n2 
swap(n1l, 
return 0; 


} 
然而 ， 这 样 并 没有 实现 交换 ， 因 为 整数 是 通过 值 而 不 是 指针 来 传递 的 。numl 和 
num2 中 保存 的 只 是 实 参 的 副本 。 修 改 numl1， 实 参 nl 不 会 变化 。 修 改 形 参 不 会 影 
响 实 参 。 图 3-4 说 明了 形 参 的 内 存 分 配 。 
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3-4: 通过 值 传递 数据 





58 | 第 3 章 





3.2.3 ”传递 指向 常量 的 指针 

传递 指向 常量 的 指针 是 C 中 常用 的 技术 ， 效 率 很 高 ， 因 为 我 们 只 传 了 数据 的 地 址 ， 
能 避免 某 些 情况 下 复制 大 量 内 存 。 不 过 ， 如 果 只 是 传递 指针 ， 数 据 就 能 被 修改 。 如 
果 不 希望 数据 被 修改 ， 就 要 传递 指向 常量 的 指针 。 

在 本 例 中 ， 我 们 传递 一 个 指向 整数 常量 的 指针 和 一 个 指向 整数 的 指针 。 在 函数 内 ， 
我 们 不 能 修改 通过 指向 常量 的 指针 传 进来 的 值 : 








void passingAddress0fConstants(const int* numl, int* num2) { 
*num2 = *numl; 


} 


int main() { 
const int limit = 100; 
int result = 5; 
passingAddress0fConstants(&limit, &result); 
return 0; 


} 


这 样 不 会 产生 语法 错误 ， 函 数 会 把 100 赋 给 result 变量 。 在 下 面 这 个 版 本 的 函数 
中 ， 我 们 试图 修改 两 个 被 引用 的 整数 : 





void passingAddress0fConstants(const int* numl, int* num2) { 
*numl 100; 
*num2 200 ; 


} 
如 果 我 们 把 Limit 篆 量 传递 给 函数 的 两 个 参数 就 会 导致 问题 : 


Const int Limit = 100; 
passingAddress0OfConstants(&limit, &limit); 


这 样 会 产生 一 个 语法 错误 ， 抱 怨 第 二 个 形 参 和 实 参 的 类 型 不 匹配 。 此 外 ， 它 还 会 抱 
怨 我 们 试图 修改 第 一 个 参数 所 引用 的 常量 。 

该 函数 期 待 一 个 整数 指针 ， 但 是 传 进来 的 却 是 指向 整数 常量 的 指针 。 我 们 不 能 把 一 
个 整数 常量 的 地 址 传递 给 一 个 指向 整数 的 指针 ， 因 为 这 样 会 允许 修改 常量 。1.4.2 市 
有 详细 讨论 。 


像 下 面 这 样 试图 传递 一 个 整数 字面 量 的 地 址 也 会 产生 语法 错误 : 

















passingAddress0OfConstants (&23, &23); 


这 种 情况 错误 信息 会 指出 取 地 址 操作 符 的 操作 数 需要 的 是 一 个 左 值 。 左 值 的 概念 在 
1.1.6 节 中 讨论 过 了 。 








3.2.4 返回 指针 
返回 指针 很 容易 ， 只 要 返回 的 类 型 是 某 种 数据 类 型 的 指针 即 可 。 从 函数 返回 对 象 时 
经 常用 到 以 下 两 种 技术 。 


。 使 用 malloc 在 函数 内 部 分 配 内 存 并 返回 其 地 址 。 调 用 者 负责 释放 返回 的 内 存 。 
。 传递 一 个 对 象 给 函数 并 让 函数 修改 它 。 这 样 分 配 和 释放 对 象 的 内 存 都 是 调用 者 的 责任 。 


首先 ， 我 们 介绍 用 malloc 这 类 函数 来 分 配 返 回 的 内 存 ， 随 后 的 示例 中 我 们 返回 一 
个 局 部 对 象 的 指针 ， 不 推荐 后 一 种 方法 。 上 面 列 出 的 第 二 种 技术 在 3.2.6 节 中 说 明 。 


在 下 面 的 例子 中 ， 我 们 定义 一 个 函数 ， 为 其 传递 一 个 整数 数组 的 长 度 和 一 个 值 来 初始 
化 每 个 元 素 。 国 数 为 整数 数组 分 配 内 存 ， 用 传人 的 值 进 行 初始 化 ， 然 后 返回 数组 地 址 : 


int* allocateArray(int size, int value) { 
int* arr = (int*)malloc(size * sizeof(int)); 
for(int i=0; i<size; i++) { 
arr[i] = value; 





























} 


return arr; 


于 
下 面 说 明 如 何 使 用 这 个 国 数 : 
int* Vector = allocateArray(5,45); 


for(int i=0; i<5; i++) { 
printf("%d\n", vector[i]); 





图 3-5 说 明了 这 个 函数 的 内 存 分 配 。 左 图 显示 return 语句 执行 前 的 程序 状态 ， 右 图 
显示 函数 返回 后 的 程序 状态 。vector 变量 包含 了 函数 内 分 配 的 内 存 的 地 址 。 当 函数 
终止 时 arr 变量 也 会 消失 ,但 是 指针 所 引用 的 内 存 还 在 ， 这 部 分 内 存 最 终 需 要 释放 。 
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图 3-5: 返回 指针 





60 | 第 3 章 





尽管 上 例 可 以 正确 工作 ,但 从 函数 返回 指针 时 可 能 存在 儿 个 潜在 的 问题 ， 包 括 : 


。 返回 未 初始 化 的 指针 ， 

。 返回 指向 无 效 地 址 的 指针 ， 
。 返回 局 部 变量 的 指针 ， 

。 返回 指针 但 是 没有 释放 内 存 。 


最 后 一 个 问题 的 典型 代表 就 是 aLLocateArray 国 数 。 从 国 数 返回 动态 分 配 的 内 存 
意味 着 函数 的 调用 者 有 责任 释放 内 存 。 看 一 下 这 个 例子 : 














int* vector = allocateArray(5,45); 


free(vector); 


最 终 我 们 必须 在 用 完 后 释放 内 存 ， 否 则 就 会 产生 内 存 泄漏 。 


3.2.5 ”局 部 数据 指针 
如 果 你 不 理解 程序 栈 如 何 工 作 ， 就 很 容易 犯 返回 指向 局 部 数据 的 指针 的 错误 。 在 下 
面 的 例子 中 ， 我 们 重 写 了 3.2.4 节 中 用 到 的 aLLocateArray 国 数 。 这 次 我 们 不 为 数 
组 动态 分 配 内 存 ， 而 是 用 了 一 个 局 部 数组 : 
int* allocateArray(int size, int value) { 
int arr[sizel]; 
for(int i=0; i<size; i++) { 
arr[i] = value; 


} 


return arr; 


} 
不 笠 的 是 ， 一 有 旦 国 数 返回 ， 返 回 的 数组 地 址 也 就 无 效 了 ， 因 为 国 数 的 栈 帧 从 栈 中 弹 
出 了 。 尽 管 每 个 数组 元 素 仍然 可 能 包含 44， 但 如 果 调 用 另 一 个 函数 ， 就 可 能 覆 写 这 
些 值 。 下 面 的 代码 段 对 此 做 了 演示 ， 重 复 调用 printf 函数 导致 数组 损坏 : 














int* Vector = allocateArray(5,45); 
for(int i=0; i<5; i++) { 
printf("%d\n", vector[i]); 





3-6 说 明了 发 生 这 种 情况 时 内 存 的 分 配 状态 。 虚 线 框 表示 其 他 的 栈 帧 〈 比 如 
printf 国 数 用 到 的 )， 可 能 会 被 推 到 程序 栈 上 ， 从 而 损坏 数组 持 有 的 内 存 。 栈 帧 的 
实际 内 容 取决 于 实现 。 
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printf 的 栈 帧 


size 600 


allocateArray | | value 604 
arr 620 


返回 之 前 
3-6; 返回 局 部 数据 的 指针 


还 有 一 种 方法 是 把 arr 变量 声明 为 static。 这 样 会 把 变量 的 作用 域 限 制 丰 
部 ， 但 是 分 配 在 栈 帧 外 面 ， 避 免 其 他 国 数 履 写 变 量 值 。 
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int* allocateArray(int size, int value) { 
static int arr[5]; 


} 


不 过 这 种 方法 并 不 一 定 总 是 有 用 。 每 次 调用 aLLocateArray 函数 都 会 重复 利用 这 
个 数组 。 这 样 相 当 于 每 次 都 把 上 一 次 调用 的 结果 覆盖 掉 。 此 外 ， 静 态 数 组 必须 声明 
为 固定 长 度 ， 这 样 会 限制 函数 处 理 变 长 数组 的 能 力 。 


如 果 函 数 只 是 返回 一 个 可 能 的 值 ， 而 且 共 享 这 些 值 也 不 会 有 什么 坏处 ， 那 么 它 可 以 
维护 一 个 这 些 值 的 列表 ， 然 后 返回 合适 的 值 。 如 果 我 们 需要 返回 状态 类 型 的 消息 ， 
比如 不 大 可 能 被 修改 的 错误 码 ， 这 么 做 就 很 有 用 。5.4 市 中 有 使 用 全 局 和 静态 值 的 
例子 。 


3.2.6 ”传递 空 指针 
下 面 这 个 版 本 的 allocateArray 函数 传递 了 一 个 数组 指针 、 数 组 的 长 度 和 用 来 初 
始 化 数组 元 素 的 值 。 返 回 指针 只 是 为 了 方便 。 这 个 版 本 的 函数 不 会 分 配 内 存 ， 但 后 
面 的 版 本 会 分 配 : 
int* allocateArray(int *arr, int size, int value) { 
if(arr != NULL) { 
for(int i=0; i<size; i++) { 


arr[i] = value; 


} 




















} 


return arr; 





将 指针 传递 给 函数 时 ， 使 用 之 前 先 判 断 它 是 否 为 空 是 个 好 习惯 。 
该 函数 可 以 像 这 样 调用 : 


int* Vector = (int*)malloc(5 * sizeof(int)); 
allocateArray(vector,5,45); 


如 果 指 针 是 NULL， 那 么 什么 都 不 会 发 生 ， 程 序 继续 执行 ， 不 会 非 正常 终止。 


3.2.7 ”传递 指针 的 指针 

将 指针 传递 给 函数 时 ， 传 递 的 是 值 。 人 dele 
需要 传递 指针 的 指针 。 在 下 例 中 ， 我 们 传递 了 一 个 整数 数组 的 指针 ， 为 该 数组 分 配 
在 关 贡生 化 ， 必 会 用 阁下 本 内 在 家 们 人 
内 存 ， 然 后 初始 化 。 所 分 配 的 内 存 地 址 应 该 被 赋 给 整数 指针 。 为 了 在 调用 函数 
中 修改 这 个 指针 ， 我 们 需要 传 入 指针 的 地 址 。 所 以 ， ee ei 
针 。 在 调用 函数 中 ， 我 们 需要 传递 指针 的 地 址 : 











void allocateArray(int **arr, int size, int value) { 
*arr = (int*)malloc(size * sizeof(int)); 
if(*arr != NULL) { 
for(int i=0; i<size; i++) { 
*(*arr+i) = value; 
} 
} 
} 


这 个 函数 可 以 用 下 面 的 代码 测试 : 


int *vector = NULL; 
allocateArray(&vector,5,45); 


allocateArray 的 第 一 个 参数 以 整数 指针 的 指针 的 形式 传递 。 当 我 们 调用 这 个 函数 
时 ， 需 要 传递 这 种 类 型 的 值 。 这 是 通过 传递 vector 地 址 做 到 的 。malloc 返回 的 地 
址 被 赋 给 arr。 解 引 整 数 指针 的 指针 得 到 的 是 整数 指针 。 因 为 这 是 vector 的 地 址 ， 
所 以 我 们 修改 了 vector。 





内 存 分 配 说 明 如 图 3-7 所 示 。 左 图 显示 malloc 返回 且 初 始 化 数组 后 的 栈 状态 。 类 
似 地 ， 右 图 显示 函数 返回 后 的 栈 状态 。 
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3-7: 传递 指针 的 指针 


才 sa 











要 方便 地 发 现 内 存 息 漏 这 样 的 问题 ， 只 需 画 一 张 内 存 分 配 图 。 


4 
3 


下 面 这 个 版 本 的 函数 说 明了 为 什么 只 传递 一 个 指针 不 会 起 作用 : 








void allocateArray(int *arr, int size, int value) { 
arr = (int*)malloc(size * sizeof (int)); 
if(arr != NULL) { 
for(int i=0; i<size; i++) { 
arr[i] = value; 


} 
} 


下 面 的 代码 段 说 明了 如 何 使 用 这 个 函数 : 


int *vector = NULL; 
allocateArray(vector,5, 45); 
printf("%p\n",vector); 


运行 后 会 看 到 程序 打印 出 0x0， 因 为 将 vector 传递 给 函数 时 ， 它 的 值 被 复制 到 了 
参数 arr 中 ， 修 改 arr 对 vector 没有 影响 。 当 函数 返回 后 ， 没 有 将 存储 在 arr 中 
的 值 复制 到 vector 中 。 图 3-8 说 明了 内 存 分 配 情况 : 左 图 显示 arr 被 赋 新 值 之 前 
的 内 存 状态 ， 中 图 显示 allocateArray 函数 中 的 malloc 函数 执行 且 初 始 化 数组 
后 的 内 存 状态 ，arr 变量 被 修改 为 指向 堆 中 的 某 个 新 位 置 ， 右 图 显示 函数 返回 后 程 
序 栈 的 状态 。 此 外 ， 这 里 有 内 存 泄漏 ， 因 为 我 们 无 法 再 访问 地 址 600 处 的 内 存 块 了 。 
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3-8: 传递 指针 
实现 自己 的 free 函 数 


由 于 free 函数 存在 一 些 问 题 ， 因 而 茶 些 程序 员 创 建 了 自己 的 free 国 数 。free 函 
数 不 会 检查 传 入 的 指针 是 否 是 NULL， 也 不 会 在 返回 前 把 指针 置 为 NULL。 释 放 指 针 
之 后 将 其 置 为 NULL 是 个 好 习惯 。 


有 了 3.2 市 中 的 基础 知识 ， 我 们 给 出 下 面 这 个 free 函数 的 实现 ， 可 以 给 指针 赋 
NULL。 此 处 需要 我 们 给 它 传递 一 个 指针 的 指针 : 











void saferFree(void **pp) { 
if (pp != NULL && *pp != NULL) { 
free(*pp); 
*pp = NULL; 
} 
} 


saferFree 函数 调用 实际 释放 内 存 的 free 函数 ， 前 者 的 参数 声明 为 void 指针 的 
指针 。 使 用 指针 的 指针 允许 我 们 修改 传 入 的 指针 ， 而 使 用 void 类 型 则 可 以 传 入 所 
有 类 型 的 指针 。 不 过 ， 如 果 调 用 这 个 函数 时 没有 显 式 地 把 指针 类 型 转换 为 void 会 
产生 警告 ,执行 显 式 转换 就 不 会 有 警告 。 


下 面 这 个 safeFree 宏 调 用 saferFree 函数 ， 执 行 类 型 转换 ， 并 使 用 了 取 地 址 操作 
符 ， 这样 就 省 去 了 函数 使 用 者 做 类 型 转换 和 传递 指针 的 地 址 : 








#define safeFree(p) saferFree( (void**)&(p)) 


下 面 的 代码 片段 说 明了 这 个 宏 的 用 法 : 








int main() { 


int *pi; 

pi = (int*) malloc(sizeof(int)); 
*pi = 5; 

printf("Before: %p\n",pi); 
safeFree(pi); 

printf("After: %p\n",pi); 
safeFree(pi); 

return (EXIT SUCCESS); 


} 


假设 malloc 返回 的 内 存 位 于 地 址 1000， 那 么 这 段 代码 的 输出 是 1000 和 0。 第 二 次 
调用 safeFree 宏 给 它 传递 NULL 值 不 会 导致 程序 终止 ， 因 为 saferFree 函数 检测 
到 这 种 情况 并 忽略 了 这 个 操作 。 


3.3 ”函数 指针 


函数 指针 是 持 有 函数 地 址 的 指针 。 指 针 能 够 指向 函数 对 于 C 来 说 是 很 重要 也 很 有 用 
的 特性 ， 这 为 我 们 以 编译 时 未 确定 的 顺序 执行 函数 提供 了 另 一 种 选择 ， 而 不 需要 使 
用 条 件 语句 。 


人 们 使 用 函数 指针 的 一 个 顾虑 是 这 种 做 法 可 能 会 导致 程序 运行 变 慢 ， 处 理 器 可 能 

法 配合 流水 线 做 分 支 预测 。 分 支 预测 是 处 理 器 用 来 推测 哪 块 代码 会 被 执行 的 技术 。 
流水 线 是 常用 的 提升 处 理 器 性 能 的 硬件 技术 ， 通 过 重 址 指令 的 执行 来 实现 。 在 这 种 
机 制 下 ， 处 理 器 会 处 理 它 认 为 能 执行 的 分 支 ， 如 果 预 测 正确 ， 那 么 就 不 需要 丢弃 当 
前 流水 线 中 的 指令 。 

函数 指针 对 性 能 的 影响 要 视 具 体 情况 而 定 。 在 表 查 找 等 场景 中 使 用 函数 指针 可 以 缓 
解 性 能 问题 。 在 本 市 中 ， 我 们 会 学 习 如 何 声明 函数 指针 ， 如 何 使 用 函数 指针 来 支持 
其 他 的 执行 路 径 ， 还 会 探索 能 够 充分 发 挥 函数 指针 潜能 的 技术 。 



































3.3.1 声明 函数 指针 

第 一 次 看 到 声明 函数 指针 的 语法 时 你 可 能 会 感到 迷惑 。 不 过 跟 C 的 很 多 方面 一 样 ， 
一 旦 熟悉 这 种 表示 法 ， 理 解 起 来 就 顺理成章 了 。 下 面 我们 声明 一 个 函数 指针 ， 该 函 
数 接受 空 参数 ， 返 回 空 值 。 


void (*fo0)(); 


这 个 声明 很 像 函 数 原型 声明 。 如 果 去 掉 第 一 对 括号 ， 看 起 来 就 像 函 数 foo 的 原型 ， 
它 接受 void， 返 回 void 指针 。 不 过 ， 插 号 让 这 个 声明 变 成 了 一 个 名 为 foo 的 函数 
指针 。 星 号 表示 这 是 个 指针 。 图 3-9 说 明了 函数 指针 声明 的 各 个 部 分 。 
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4 
涤 


void (*fo0)(); 


返回 类 型 ”函数 指针 变量 
的 名 字 























3-9: 函数 指针 声明 


对 




















i 数 指针 时 一 定 要 小 心 ， 因 为 C 不 会 检查 参数 传递 是 否 正 确 。 


下 面 是 声明 函数 指针 的 其 他 一 些 例子 ， 
int (*f1) (double); // 传 入 double， 返回 int 
void (*f2)(char*); // 传人 char 指针 ， 没 有 返回 值 
double* (*f3) (int, int); // 传递 两 个 整数 ， 返 回 double 指针 


考 3 


4 | 我 们 对 函数 指针 在 命名 约定 上 的 建议 是 用 fptr 做 前 级 。 








不 要 把 返回 指针 的 函数 和 函数 指针 搞 混 。 下 面 的 f4 是 一 个 函数 ， 它 返回 一 个 整数 指 
针 ， 而 f5 是 一 个 返回 整数 的 函数 指针 ， 变 量 f6 是 一 个 返回 整数 指针 的 函数 指针 。 


int *f4(); 
int (wf5)(); 
的 让 


可 以 调整 这 些 表 达 式 中 的 空白 符 ， 如 下 所 示 : 


int* f4(); 
int (*f5)(); 
显 ，f4 是 个 返回 整数 指针 的 函数 ， 而 f5 的 括号 则 明确 地 把 表示 “指针 ”的 星 
和 国 数 名 绑 定 在 一 起 ， 所 以 它 是 个 国 数 指针 。 


3.3.2 ”使 用 函数 指针 

下 面 是 使 用 函数 指针 的 一 个 简单 示例 ， 其 中 函数 接受 一 个 整数 参数 并 返回 一 个 整数 。 
我 们 也 定义 了 square 函数 ， 对 一 个 整数 求 平方 并 返回 值 。 为 了 简化 例子 ， 假 定 束 
数 不 会 溢出 。 
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int (*#fptrl)(int) ; 


int Square(int num) { 
return num*num; 


} 
要 用 函数 指针 来 调用 square 函数， 需要 把 square 函数 的 地 址 赋 给 函数 指针 ， 如 
下 所 示 。 就 像 数 组 名 字 一 样 ， 我 们 用 的 是 函数 本 身 的 名 字 ， 它 会 返回 函数 的 地 址 。 
我 们 还 声明 了 一 个 整数 并 将 其 传递 给 函数 : 


瑟 











了 Ti 七 全 253 
fptrl = Square 
printf("%d squared is %d\n",n, fptr1(n)); 


执行 代码 后 会 显示 “5 squared is 25.”。 我 们 也 可 以 像 下 面 那 样 用 取 地 址 操作 符 对 函数 
名 进行 操作 ， 但 是 没 必 要 这 么 做 。 在 这 种 上 下 文 环 境 中 编译 器 会 忽略 取 地 址 操作 符 。 


fptrl = &square; 





图 3-10 说 明了 本 例 的 内 存 分 配 。 我 们 把 square 国 数 放 在 程序 栈 下 方 。 这 只 是 举例 
子 ， 实 际 上 函数 会 被 分 配 在 跟 程序 栈 所 用 段 不 同 的 段 上 。 函 数 的 实际 地 址 通常 对 我 
们 没 用 。 

















图 3-10: 函数 的 位 置 
为 函数 指针 声明 一 个 类 型 定义 会 比较 方便 ， 下 面 说 明 对 于 之 前 用 到 的 函数 指针 应 
该 怎么 做 。 类 型 定义 看 起 来 有 点 奇怪 ， 通常， 类 型 定义 的 名 字 是 声明 的 最 后 一 个 
元 素 。 























typedef int (*funcptr) (int); 





funcptr fptr2 
fptr2 = Square 
printf("%d squared is %d\n",n, fptr2(n)); 


5.5 市 提供 了 一 个 有 趣 的 例子 ， 讲 的 是 用 函数 指针 来 控制 字符 串 的 排序 方式 。 


3.3.3 ”传递 函数 指针 


传递 函数 指针 很 简单 ， 只 要 把 函数 指针 声明 作为 函数 参数 即 可 。 我 们 会 用 下 面 这 个 
例子 中 的 add、sub 和 compute 函数 来 说 明 如 何 传 递 函 数 指针 : 
int add(int numl, int num2) { 


return numl + num2; 


} 


int subtract(int numl, int num2) 区 
return numl - num2; 


} 
typedef int (*fptrOperation)(int,int); 
int compute(fptroperation operation, int numl, int num2) { 


return operation(numl, num2); 


} 
下 面 的 代码 片段 说 明 如 何 使 用 这 些 函 数 : 


printf("%d\n",compute(add,5,6)); 
printf("%d\n",compute(subtract,5,6)); 





输出 是 11 和 一 1。add 和 sub 函数 的 地 址 被 传递 给 compute 函数 ， 后 者 使 用 这 些 地 
址 来 调用 对 应 的 操作 。 本 例 也 说 明了 使 用 函数 指针 可 以 让 代码 变 得 更 灵活 。 


3.3.4 返回 函数 指针 
返回 函数 指针 需要 把 函数 的 返回 类 型 声明 为 函数 指针 ， 为 了 说 明 如 何 实现 这 一 点 ， 
我 们 会 沿用 3.3.3 节 中 的 add 和 sub 函数 ， 以 及 类 型 定义 。 


我 们 用 下 面 的 select 函数 基于 输入 的 字符 来 返回 一 个 指向 对 应 操作 的 函数 指针 。 
取决 于 传 入 的 操作 码 ， 它 要 么 返回 add 函数 ， 要 么 返回 sub 函数 。 











fptrOperation select(char opcode) { 
switch(opcode) { 
case '+': return add; 
Case '-': return subtract; 








evaluate i 0 该 函数 接受 两 个 整数 和 一 个 字符 ， 字 符 代 
表 要 做 的 操作 ， 它 会 把 opcode 传递 给 select 函数 ， Be 0 的 函数 指针 。 
在 返回 语句 中 ，evaluate 函数 执行 人 数 并 返回 结 








int evaluate(char opcode, int numl, int num2) { 
fptroperation operation = select(opcode); 
return operation(numl, num2); 


} 
evaluate 函数 及 printf 语句 的 用 法 如 下 所 示 : 


printf("%d\n",evaluate('+', 5, 6)); 
printf("%d\n",evaluate('-', 5, 6)); 


输出 是 11 和 -1。 


3.3.5 ”使 用 函数 指针 数组 

函数 指针 数组 可 以 基于 某 些 条 件 选 择 要 执行 的 函数 ， 声 明 这 种 数组 很 简单 ， 只 要 把 
函数 指针 声明 为 数组 的 类 型 即 可 ， 。 这 个 数组 的 所 有 元 素 都 被 初始 化 为 
NULL。 如 果 数 组 的 初始 化 值 是 一 个 语句 块 ， 系 统 会 将 块 中 的 值 赋 给 连续 的 数组 元 
素 。 本 例 中 只 有 一 个 值 ， 我 们 会 用 这 个 值 来 初始 化 数组 的 所 有 元 素 。 





typedef int (*operation)(int, int); 
operation operations[128] = {NULL}; 


也 可 以 不 用 typedef 来 声明 这 个 数组 ， 如 下 : 
int (*operations[128])(int, int) = {NULL}; 
这 个 数组 的 目的 是 可 以 用 一 个 字符 索引 选择 对 应 的 函数 来 执行 。 比 如 ， en 
字符 就 表示 乘法 函数 ， 我 们 可 以 用 字符 作为 索引 是 因为 字符 字面 量 其 实 是 整数 ，128 


个 元 素 对 应 前 128 个 ASCII 字符 。 我 们 会 把 这 个 定义 用 在 3.3.4 节 中 实现 的 add、 
sub 函数 上 。 


数组 初始 化 为 NULL 后 ， 我 们 把 add 和 sub 函数 赋 给 加 号 和 减 号 对 应 的 元 素 : 























void initiaLize0perationsArray() { 
operations['+'] = add; 
operations['-'] = subtract; 


} 


将 前 面 的 evaluate 函数 改写 为 evaluateArray。 接 下 来 我 们 用 操作 字符 作为 索引 
来 使 用 operations， 而 不 是 调用 select 函数 来 获取 函数 指针 。 





int evaluateArray(char opcode, int numl, int num2) { 
fptroperation operation; 
operation = operations[opcode]; 
return operation(numl, num2); 


} 
用 下 面 的 代码 测试 这 些 函 数 : 


initializeOperationsArray(); 
printf("%d\n",evaluateArray('+', 5, 6)); 
printf("%d\n",evaluateArray('-', 5, 6)); 


执行 结果 是 11 和 -1。 更 健壮 的 evaluateArray 函数 版 本 需要 在 执行 函数 之 前 检 


查 空 指针 。 


3.3.6 比较 函数 指针 

我 们 可 以 用 相等 和 不 等 操作 符 来 比较 函数 指针 。 下 例 中 用 到 了 fptr0peration 类 
型 定义 和 3.3.3 节 中 的 add 函数 。add 函数 被 赋 给 fptrl 函数 指针 ， 然 后 和 add 国 
数 的 地 址 做 比较 : 


fptroperation fptrl = add; 


if(fptrl == add) { 

printf("fptrl points to add function\n"); 
} else{ 

printf("fptrl does not point to add function\n"); 
} 


执行 这 段 代 码 后 ， 通 过 输出 可 以 看 到 指针 确实 指向 了 add 函数 。 


可 以 说 明 比 较 函 数 指针 用 处 的 一 个 更 现实 的 例子 是 ， 用 函数 指针 数组 表示 一 系列 任 
务 步骤 的 情况 。 比 如 说 ， 我 们 可 能 会 有 一 系列 函数 维护 一 个 库存 部 件数 组 。 可 能 
一 组 操作 来 对 部 件 排序 ， 计 算 总 数 ， 然 后 打印 出 数组 和 总 数 ， 用 另 一 组 操作 打印 数 
组 ， 找 到 最 贵 和 最 便宜 的 部 件 ， 然 后 显示 差额 。 每 种 操作 都 可 以 用 指向 各 自 函 数 的 
指针 的 数组 来 表示 。 日 志 操 作 可 能 同时 出 现在 上 述 两 组 操作 中 。 借 助 比较 两 个 函数 
指针 ， 我 们 可 以 通过 删除 某 个 操作 (比如 日 志 ) 来 动态 修改 操作 ， 只 要 从 列表 中 找 
到 并 删除 对 应 的 国 数 指针 即 可 。 


3.3.7 ”转换 函数 指针 

我 们 可 以 将 指向 某 个 函数 的 指针 转换 为 其 他 类 型 的 指针 ， 不 过 要 谨慎 使 用 ， 因 为 运 
行 时 系统 不 会 验证 函数 指针 所 用 的 参数 是 否 正确 。 也 可 以 把 一 种 函数 指针 转换 为 另 
一 种 再 转换 回来 ， 得 到 的 结果 和 原 指针 相同 ， 但 函数 指针 的 长 度 不 一 定 相等 。 下 面 
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的 代码 说 明了 这 个 操作 : 


typedef int (*fptrToSingleInt)(int); 
typedef int (*fptrToTwoInts)(int,int); 
int add(int, int); 


fptrToTwoInts fptrFirst = add; 

fptrToSingleInt fptrSecond = (fptrToSingleInt)fptrFirst; 
fptrFirst = (fptrToTwoInts)fptrSecond; 
printf("%d\n",fptrFirst(5,6)); 


这 段 代 码 执行 后 输出 11。 





-Ee 无 法 保证 函数 指针 和 数据 指针 相互 转换 后 正常 工作 。 











void* 指针 不 一 定 能 用 在 函数 指针 上 ， 也 就 是 说 我 们 不 应 该 像 下 面 这 样 把 函数 指针 
赋 给 void* 指针 : 


void* pv = add; 


不 过 在 交换 函数 指针 时 ， 通 常会 见 到 如 下 声明 所 示 的 “基本 ”函数 指针 类 型 。 这 里 
把 fptrBase 声明 为 指向 不 接受 参数 也 不 返回 结果 的 函数 的 函数 指针 。 





typedef void (*fptrBase)(); 


下 面 的 代码 片段 说 明了 基本 指针 的 用 法 ， 跟 上 一 个 例子 是 一 样 的 效果 : 





fptrBase basePointer; 

fptrFirst = add; 

basePointer = (fptrToSingleInt)fptrFirst; 
fptrFirst = (fptrToTwoInts)basePointer; 
printf("%d\n",fptrFirst(5,6)); 


基本 指针 用 做 占 位 符 ， 用 来 交换 函数 指针 的 值 。 





-Ee 一 定 要 确保 给 函数 指针 传递 正确 的 参数 ， 否 则 会 造成 不 确定 的 行为 。 











3.4 小 结 


理解 程序 栈 和 堆 有 助 于 更 深入 彻底 地 理解 程序 的 工作 方式 以 及 指针 的 行为 。 在 本 章 
中 ， 我 们 研究 了 栈 、 堆 和 栈 帧 ， 这 些 概念 对 解释 将 指针 传递 给 函数 和 从 国 数 返回 指 
针 的 机 制 有 帮助 。 
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比如 说 ， 返 回 指 向 局 部 变量 的 指针 是 错误 的 ， 原 因 是 为 局 部 变量 分 配 的 内 存 会 在 后 
续 的 函数 调用 中 被 覆盖 。 传 递 指向 常量 数据 的 指针 很 高 效 ， 还 可 以 防止 函数 修改 传 
入 的 数据 。 传 递 指针 的 指针 可 以 让 参数 指针 指向 不 同 的 内 存 地 址 ， 栈 和 堆 可 以 帮助 
深入 解释 这 些 功能 。 

我 们 也 介绍 和 讲解 了 函数 指针 ， 这 类 指针 允许 应 用 程序 根据 需要 执行 不 同 的 函数 ， 
对 于 控制 应 用 程序 内 的 执行 序列 很 有 用 。 
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第 4 章 


指针 和 数组 








数组 是 C 内 建 的 基本 数据 结构 ， 彻 底 理解 数组 及 其 用 法 是 开发 高 效应 用 程序 的 基 
础 。 曲 解数 组 和 指针 的 用 法 会 造成 难以 查找 的 错误 ， 应 用 程序 的 性 能 也 难以 达到 最 
优 。 数 组 和 指针 表示 法 紧密 关联 ， 在 合适 的 上 下 文中 可 以 互 换 。 


一 种 常见 的 错误 观点 是 数组 和 指针 是 完全 可 以 互 换 的 。 尽 管 数组 名 字 有 了 时候 可 以 当 
做 指针 来 用 ， 但 数组 的 名 字 不 是 指针 。 数 组 表示 法 也 可 以 和 指针 一 起 使 用 ， 但 两 者 
明显 不 同 ， 也 不 一 定 能 互 换 。 理 解 这 种 差别 可 以 帮助 你 避免 错误 地 使 用 这 些 表 示 法 。 
比如 说 ， 尽 管 数组 使 用 自身 的 名 字 可 以 返回 数组 地 址 ， 但 是 名 字 本 身 不 能 作为 赋值 
操作 的 目标 。 


数组 在 应 用 程序 中 随处 可 见 ， 可 能 是 一 维 ， 也 可 能 是 多 维 。 在 本 章 中 ， 我 们 会 讲解 
数组 跟 指 针 相 关 的 基础 知识 ， 以 便 你 深入 理解 数组 以 及 使 用 指针 操作 数组 的 各 种 方 
法 。 本 书 其 他 章节 还 会 展示 在 更 高 级 的 环境 中 使 用 数组 和 指针 。 

本 章 首先 概述 数组 ， 然 后 研究 数组 表示 法 和 指针 表示 法 的 相同 点 和 不 同 点 。 可 以 用 
malloc 类 函数 创建 数组 ， 这 些 函 数 提 供 比 传统 的 数组 声明 更 灵活 的 机 制 。 我 们 会 
看 到 如 何 用 realloc 函数 来 改变 已 经 为 一 个 数组 分 配 的 内 存 大 小 。 

为 数组 动态 分 配 内 存 可 以 为 代码 带 来 很 大 的 改变 ， 特 别 是 处 理 二 维 或 多 维 数 组 的 情 
况 ， 因 为 我 们 得 确保 为 数组 分 配 的 内 存 是 连续 的 。 

我 们 也 会 探索 传递 和 返回 数组 时 可 能 发 生 的 问题 。 大 部 分 情况 下 ， 必 须 传人 数组 长 
度 以 便 函 数 正 确 处 理 数组 。 数 组 的 内 部 表示 不 带 有 长 度 信息 ， 如 果 我 们 不 传递 长 度 ， 
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国 数 就 没有 标准 的 方法 得 到 数组 的 终点 。 即 便 并 不 常用 ， 我 们 也 会 研究 如 何在 C 中 
创建 不 规则 数组 。 不 规则 数组 是 二 维 数组 ， 每 一 行 都 可 能 包含 不 同 的 列 数 。 


要 说 明 这 些 概念 ， 需 要 使 用 向 量 和 矩阵， 前 者 代表 一 维 数 组 ， 后 者 代表 二 维 数组 。 
向 量 和 和 矩阵 用 途 广泛 ， 包 括 电磁 场 分析 、 天 气 预报 和 数学 上 的 应 用 。 


4.1 数组 概述 


数组 是 能 用 索引 访问 的 同 质 元 素 连 续集 合 。 这 里 所 说 的 连续 是 指数 组 的 元 素 在 内 存 
中 是 相 邻 的 ， 中 间 不 存在 空 际 ， 而 同 质 是 指 元 素 都 是 同一 类 型 的 。 数 组 声明 用 的 是 
方 括号 集合 ， 可 以 拥有 多 个 维度 。 

二 维 数组 很 常见 ， 我 们 一 般 用 行 和 列 来 表述 数组 元 素 的 位 置 。 三 维 或 更 多 维 的 数组 
不 是 很 常见 ， 不 过 有 些 应 用 程序 会 用 到 。 不 要 混淆 二 维 数 组 和 指针 的 数组 ， 它 们 很 
类 似 ， 但 是 行为 有 点 差别 ， 我 们 会 在 4.6 节 中 讲 到 。 


C99 标准 引入 了 变 长 数组 ， 在 此 之 前 ， 支 持 变 长 数组 的 技术 是 用 realloc 函数 实现 
的 。 我 们 会 在 4.4 节 中 说 明 realloc 国 数 。 

















4 数组 的 长 度 是 固定 的 ， 当 我 们 声明 数组 时 ， 需 要 决定 该 数组 有 多 大 。 如 果 

心 。 指 定 过 多 元 素 就 会 浪费 空间 ， 而 指定 过 少 元 素 就 会 限制 能 够 处 理 的 元 素数 

二， 量 。realloc 函数 和 变 长 数组 提供 了 应 对 长 度 需要 变化 的 数组 的 技术 。 只 
要 略 施 小 计 ， 我 们 就 能 调整 数组 长 度 ， 只 占用 合适 的 内 存 。 














4.1.1 一 维 数组 
一 维 数组 是 线性 结构 ， 用 一 个 索引 访问 成 员 。 下 面 的 代码 声明 了 一 个 5 个 元 素 的 整 
数 数组 : 


int vector[5]; 


数组 索引 从 0 开始， 到 声明 的 长 度 减 1 结束 。vector 数组 的 索引 从 0 开始， 到 4 
结束 。 不 过 ，C 并 没有 强制 规定 边界 ， 用 无 效 的 索引 访问 数组 会 造成 不 可 预期 的 行 
为 。 图 4-1 说 明了 数组 的 内 存 如何 分 配 ， 每 个 元 素 4 字 市 长 ， 且 没有 初始 化 。 就 像 
1.2.1 市 中 所 解释 的 ， 取 决 于 不 同 的 内 存 模型 ， 数 组 的 长 度 可 能 会 不 同 。 


数组 的 内 部 表示 不 包含 其 元 素数 量 的 信息 ， 数 组 名 字 只 是 引用 了 一 块 内 存 。 对 数组 
做 sizeof 操作 会 得 到 为 该 数组 分 配 的 字 市 数 ， 要 知道 元 素 的 数量 ， 只 需 将 数组 长 
度 除 以 元 素 长 度 ， 如 下 所 示 ， 打 印 结果 是 5: 
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printf("%d\n", sizeof(vector)/sizeof(int)); 





vector[0] 100 | .| 
vector[1] 104 | ... | 
vector[2] 108 | .| 
vector[3] 112 | ... | 
vector[4] 116 | ... | 











4-1: 数组 的 内 存 分 配 


可 以 用 一 个 块 语句 初始 化 一 维 数组 ， 下 面 的 代码 把 数组 中 的 元 素 初 始 化 为 从 1 开始 
的 整数 : 


int vector[5] = {1, 2, 3, 4, 5}; 


4.1.2 ”二 维 数 组 
二 维 数 组 使 用 和 ti 只 数组 元 素 ， ys 
在 C 中 这 是 通过 行 - 列 顺序 实现 的 。 先 将 数组 的 第 一 行 放 进 内 存 ， 接 着 是 第 二 行 、 
Si 


ee abe i 用 块 语句 对 数组 进行 了 初始 化 。 图 4-2 说 明 
这 个 数组 的 内 存 分 配 ， 左 图 说 明 内 存 如 何 映射 ， 右 图 显示 数组 在 概念 上 的 样子 。 


int matrix[2][3] = {{1,2,3},{4,5,6}}; 


























matrix[OJ[0] 100 [1 | 列 
matrix[OJ[1] 104 | 2 | 0 1 2 
matrix[0][2] 108 | 3 | | 11|12 13 
matrix[1][0] 112 Tm 
matrix[1[1 116 | 5 | 

matrix[1][2]120 | 6 | 








4-2: 二 维 数组 


我 们 可 以 将 二 维 数组 当做 数组 的 数组 ， 也 就 是 说 ， 如 果 只 用 一 个 下 标 访问 数组 ， 得 
到 的 是 对 应 行 的 指针 。 下 面 的 代码 说 明了 这 个 概念 ， 它 会 打印 每 一 行 的 地 址 和 长 度 : 

















for (int i = 0; i < 2; i++) { 
printf("&matrix[%d]: %p sizeof(matrix[%d]): %d\n", 
i, &matrix[i], i, sizeof (matrix[i])); 


} 


下 面 的 输出 假设 数组 位 于 地 址 100， 因 为 每 行 有 3 个 元 素 ， 每 个 元 素 4 字 节 长 ， 所 
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以 数组 长 度 是 12: 


Smatrix[0]: 100 sizeof (matrix[0]): 12 
Smatrix[1]: 112 sizeof (matrix[1]): 12 


在 4.7 市 中 我 们 会 深入 研究 这 种 行为 。 


4.1.3 多维 数 组 
多 维 数 组 具有 两 个 及 两 个 以 上 维度 。 对 于 多 维 数 组 ， 需 要 多 组 括号 来 定义 数组 的 类 
型 和 长 度 。 下 面 的 例子 中 ， 我 们 定义 了 一 个 具有 3 行 、2 列 、4 阶 的 三 维 数组 。 阶 通 
常用 来 标识 第 三 维 元 素 。 
int arr3d[3][2][4] = { 
{{1, 2, 3, 4}, {5, 6, 7, 8}}, 


{{93- 40% 1, 2}7 {13 14y 153. 03 
{{17, 18, 19, 20}, {21, 22, 23, 24}} 





和 


元 素 按照 行 - 列 - 阶 的 顺序 连续 分 配 ， 如 图 4-3 所 示 。 








arr3d[0][0] 
arr3d[0][0] 
arr3d[0][0] 
arr3d[0][0] 
arr3d[0][1] 
arr3d[0][1] 











ar3dD2II1031192 [24 ] 











图 4-3: 三 维 数组 
我 们 会 在 后 面 的 例子 中 用 到 这 些 声 明 。 


4.2 ”指针 表示 法 和 数组 

指针 在 处 理 数组 时 很 有 用 ， 我 们 可 以 用 指针 指向 已 有 的 数组 ， 也 可 以 从 堆 上 分 配 内 
存 然后 把 这 块 内 存 当 做 一 个 数组 使 用 。 数 组 表示 法 和 指针 表示 法 在 某 种 意义 上 可 以 
互 换 。 不 过 ， 它 们 并 不 完全 相同 ， 后 面 的 “数组 和 指针 的 差别 ”中 会 详细 说 明 。 


单独 使 用 数组 名 字 时 会 返回 数组 地 址 。 我 们 可 以 把 地 址 赋 给 指针 ， 如 下 所 示 : 








int vector[5] = {1, 2, 3, 4, 5}; 
int *pv = vector; 
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pv 变量 是 指向 数组 第 一 个 元 素 而 不 是 指向 数组 本 身 的 指针 。 给 pv 赋值 是 把 数组 的 
第 一 个 元 素 的 地 址 赋 给 pv。 

我 们 可 以 只 用 数组 名 字 ， 也 可 以 对 数组 的 第 一 个 元 素 用 取 地 址 操作 符 ， 如 下 所 示 。 
这 些 写 法 是 等 价 的 ， 都 会 返回 vector 的 地 址 。 用 取 地 址 操作 符 更 繁琐 一 些 ， 不 过 
也 更 明确 。 


printf("%p\n",vector); 
printf("%p\n",&vector[0]); 





有 时候 也 会 使 用 &vector 这 个 表达 式 获 取 数 组 的 地 址 ， 不 同 于 其 他 表示 法 ， 这 么 做 
返回 的 是 整个 数组 的 指针 ， 其 他 两 种 方法 得 到 是 整数 指针 。 这 种 类 型 的 用 法 会 在 4.8 
市 解释 。 


我 们 可 以 把 数组 下 标 用 在 指针 上 ， 实 际 上 ，pv[i] 这 种 表示 法 等 价 于 : 





*(pv + i) 


pv 指针 包含 一 个 内 存 块 的 地 址 ， 方 括号 表示 法 会 取出 pv 中 包含 的 地 址 ， 用 指针 算 
术 运 算 把 索引 i 加 上 ， 然 后 解 引 新 地 址 返回 其 内 容 。 


就 像 我 们 在 1.3.1 闻 中 讨论 的 那样 ， 给 指针 加 上 一 个 整数 会 把 它 持 有 的 地 址 增加 这 
个 整数 和 数据 类 型 长 度 的 乘积 ， 这 一 点 对 于 给 数组 名 字 加 上 整数 也 适用 。 下 面 两 个 


语句 是 等 价 的 : 





*(pv + i) 
*(vector + i) 





假设 vector 位 于 地 址 100，pv 位 于 地 址 96， 表 4-1 和 图 4-4 说 明了 如 何 利 用 数组 
下 标 和 指针 算术 运算 分 别 从 数组 名 字 和 指针 得 到 不 同 的 值 。 


表 4-1: 数组 /指针 表示 法 








值 等 价 表达 式 

92 &vector[-2] vector - 2 &pv[-2] pv -2 
100 vector vector + 0 &pv[0] pv 

100 &vector[0] vector + 0 &pv[0] pv 

104 &vector[1] vector + 1 &pv[1] pv+1 
140 &vector[10] vector + 10 &pv[10] pv + 10 
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92| .| &vector-2] vector-2  &pv[-2] pv-2 





Vector 二 0 &pvI0] pv 
Vector+1 &pvIl] pv+1 


140 [| &vectorl10] Vector 十 10 &pv[10] pv+10 








4-4: 数组 /指针 表示 法 


给 数组 地 址 加 1 实际 加 了 4， 也 就 是 整数 的 长 度 ， 因 为 这 是 一 个 整数 数组 。 对 于 第 
一 个 和 最 后 一 个 操作 ， 我 们 越过 了 数组 边界 ， 这 不 是 好 习惯 ， 不 过 也 提醒 我 们 在 用 
索引 和 指针 访问 数组 元 素 时 要 谨慎 。 


数组 表示 法 可 以 理解 为 “ 偏 移 并 解 引 ”操作 。vector[2] 表达 式 表示 从 vector 开 
台 ， 向 右 偏 移 两 个 位 置 ， 然 后 解 引 那个 位 置 获取 其 值 ， 其 中 vector 是 指向 数组 起 
始 位 置 的 指针 。 如 果 用 取 地 址 操作 符 和 数组 表示 法 ， 就 像 &vector[ -2] ， 其 实 就 是 
去 掉 了 解 引 操作 ， 可 以 解释 为 向 左 偏 移 两 个 位 置 然 后 返回 地 址 。 


下 面 的 代码 说 明了 标量 相 加 操作 的 实现 中 指针 的 使 用 。 这 个 操作 接受 一 个 值 然 后 给 
vector 的 每 个 元 素 乘 上 这 个 值 : 

















pv = Vector ， 

int value = 3; 

for(int i=0; i<5; i++) { 
*pv++ *= Value; 


} 


数组 和 指针 的 差别 
数组 和 数组 指针 在 使 用 上 有 一 些 区 别 ， 本 节 使 用 的 vector 数组 和 pv 指针 定义 如 下 : 
int vector[5] = {1, 2, 3, 4, 5}; 
int *pv = vector; 
vector[i] 生成 的 代码 和 *(vector+i) 生成 的 不 一 样 ，vector[i] 表示 法 生成 的 
机 器 码 从 位 置 vector 开始 ， 移 动 i 个 位 置 ， 取出 内 容 。 而 *(vector+i) 表示 法 
生成 的 机 器 码 则 是 从 vector 开始 ， 在 地 址 上 增加 i， 然后 取出 这 个 地 址 中 的 内 容 。 
尽管 结果 是 一 样 的 ， 生 成 的 机 器 码 却 不 一 样 ， 对 于 大 部 分 人 来 说 ， 这 种 差别 几乎 无 
足 轻 重 。 





























sizeof 操作 符 对 数组 和 同一 个 数组 的 指针 操作 也 是 不 同 的 。 对 vector 调用 


sizeof 操作 符 会 返 





回 20， 就 是 这 个 数组 分 配 的 字 节 数 。 对 pv 调用 sizeof 操作 符 


会 返回 4， 就 是 指针 的 长 度 。 


pv 是 一 个 左 值 ， 左 值 表 示 赋 值 操作 符 左边 的 符号 。 左 值 必 须 能 修改 。 像 vector 这 
样 的 数组 名 字 不 是 左 值 ， 它 不 能 被 修改 。 我 们 不 能 改变 数组 所 持 有 的 地 址 ， 但 可 以 
给 指针 赋 一 个 新 值 从 而 引用 不 同 的 内 存 段 。 





考虑 如 下 代码 : 


pv= pv+1; 
vector = vector 


+ 1; // 语法 错误 


我 们 无 法 修改 vector， 只 能 修改 它 的 内 容 。 不 过 ，vector+1 表达 式 本 身 没 问题 ， 


如 下 所 示 : 


pv = Vector + 1; 


4.3 用 mal 


Loc 创 建 一 维 数组 


如 果 从 堆 上 分 配 内 存 并 把 地 址 赋 给 一 个 指针 ， 那 就 肯定 可 以 对 指针 使 用 数组 下 标 并 
把 这 块 内 存 当 成 一 个 数组 。 在 下 面 的 代码 中 ， 我 们 复制 之 前 用 过 的 数组 vector 中 


的 内 容 : 


int *pv = (int*) malloc(5 * sizeof(int)); 
for(int i=0; i<5; i++) { 


pv[i] = i+l; 


} 


也 可 以 像 下 面 这 样 使 用 指针 表示 法 ， 不 过 数组 表示 法 通常 更 简单 : 


for(int i=0; i<5; i++) { 
*(pv+i) = i+l; 


} 





图 4-5 说 明了 本 例 的 内 存 分配 。 














4-5: 从 堆 上 分 配 数组 
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这 种 技术 分 配 一 块 内 存 并 把 它 当 成 数组 ， 其 长 度 在 运行 时 确定 。 不 过 ， 我 们 得 记得 
用 完 之 后 释放 内 存 。 





在 上 个 例子 中 我 们 用 的 是 *(pv+i) 而 不 是 *pv+i， 因 为 解 引 操作 符 的 优先 
一 EB》 级 比 加 操作 符 高 ， 先 解 引 第 二 个 表达 式 的 指针 ， 得 到 指针 所 引用 的 值 ， 然 
后 再 给 这 个 整数 加 上 i。 这 不 是 我 们 要 的 效果 ， 而 且 ， 如 果 我 们 把 这 个 表 
达 式 作为 左 值 ， 编 译 器 会 抱 急 。 所 以 ， 为 了 让 代码 正确 工作 ， 我 们 需要 强 
制 先 做 加 法 ， 然 后 才 是 解 引 操作 。 


















































4.4 ”用 realloc 调 整数 组 长 度 


用 malloc 创建 的 已 有 数组 的 长 度 可 以 通过 realloc 函数 来 调整 。realloc 函数 的 
基本 知识 已 经 在 第 2 章 详细 探讨 过 了 。C99 标准 支持 变 长 数组 ， 有 些 情 况 下 这 种 解 
决 方案 可 能 比 使 用 realloc 函数 更 好 。 如 果 没 有 使 用 C99， 那 就 只 能 用 realloc。 
此 外 ， 变 长 数组 只 能 在 函数 内 部 声明 ， 如 果 数 组 需要 的 生命 周期 比 函 数 长 ， 那 也 只 


能 用 realloc。 








为 了 说 明 realloc 国 数 ， 我 们 会 实现 一 个 从 标准 输入 读 取 字符 并 放 入 缓冲 区 的 图 
数 ， 缓 冲 区 会 包含 除 最 后 的 回 车 字符 之 外 的 所 有 字符 。 我 们 无 法 得 知 用 户 会 输入 多 
少 字 符 ， 因 此 也 就 无 法 知道 缓冲 区 应 该 有 多 长 。 我 们 会 用 realloc 函数 通过 一 个 定 
长 增 量 来 分 配额 外 空间 。 实 现 该 国 数 的 代码 如 下 所 示 : 





char* getLine(void) { 
const size t sizeIncrement = 10; 
char* buffer = malloc(sizeIncrement); 
char* currentPosition = buffer; 
size t maximumLength = sizeIncrement; 
size t length = 0; 
int character; 


if(currentPosition == NULL) { return NULL; } 


while(1) { 
character = fgetc(stdin); 
if(character == '\n') { break; } 


if(++length >= maximumLength) { 
char *newBuffer = realloc(buffer, maximumLength += SizeIncrement ) ; 


if(newBuffer == NULL) { 
free(buffer); 
return NULL; 





currentPosition = newBuffer + (currentPosition - buffer); 
buffer = newBuffer; 


} 

*currentPosition++ = character; 
} 
*currentPosition = '\0'; 


return buffer; 


} 
首先 我 们 声明 了 一 系列 变量 ， 总 结 在 表 4-2 中 。 





表 4-2: getLine 函 数 的 变量 























sizeIncrement 缓冲 区 的 初始 大 小 以 及 需要 增 大 时 的 增 量 
buffer 指向 读 入 字符 的 指针 

currentPosition 指向 缓冲 区 中 下 一 个 空白 位 置 的 指针 
maximumLength 可 以 安全 地 存 入 缓冲 区 的 最 大 字符 数 
length 读 入 的 字符 数 

character 上 次 读 入 的 字符 数 























缓冲 区 创建 时 的 大 小 是 sizeIncrement， 如 果 malloc 函数 无 法 分 配 内 存 ， 第 一 个 
if 语句 会 强制 getLine 函数 返回 NULL。 接 着 是 一 次 处 理 一 个 字符 的 无 限 循环 ， 循 
环 退出 后 ， 字 符 串 未 尾 会 添加 上 NUL， 然 后 返回 缓冲 区 的 地 址 。 

















在 while 循环 内 部 ， 程 序 每 次 读 和 一 个 字符 ， 如 果 是 回 车 符 ， 循 环 退 出 。 接 着 ，if 
语句 判断 我 们 有 没有 超出 缓冲 区 大 小 ， 如 果 没 有 超出 ， 字 符 就 被 添加 到 缓冲 区 中 。 























如 果 超 出 了 缓冲 区 大 小 ，realloc 函数 会 分 配 一 块 新 内 存 ， 这 块 内 存 比 旧 内 存 大 
sizeIncrement 字 节 。 如 果 无 法 分 配 内存 ， 我 们 会 释放 现 有 的 已 分 配 内 存 ， 强 制 函 
数 返 回 NULL; 否则 currentPosition 会 调整 为 指向 新 分 配 的 缓冲 区 。realloc 国 
数 不 一 定 会 让 已 有 的 内 存 保持 在 原来 的 位 置 ， 所 以 必须 用 它 返回 的 指针 来 确定 调整 
过 大 小 的 内 存 块 的 位 置 。 


newBuffer 变量 持 有 已 分 配 内 存 的 地 址 ， 我 们 需要 用 别 的 变量 而 不 是 buffer， 这 
样 万 一 realloc 无 法 分 配 内 存 ， 我 们 也 可 以 检测 到 这 种 情况 并 进行 处 理 。 
































如 果 realloc 分 配 成 功 ， 我 们 不 需要 释放 buffer， 因 为 reaLLoc 会 把 原来 的 缓冲 
区 复制 到 新 的 缓冲 区 中 ， 再 把 旧 的 释放 。 如 果 试 图 释放 buffer， 十 有 八 九 程序 会 
终止 ， 因 为 我 们 试图 重复 释放 同一 块 内 存 。 











图 4-6 说 明了 getLine 国 数 面 对 Once upon atime there was a giant pumpkin 这 
个 输入 字符 串 时 的 内 存 分 配 情 况 。 我 们 简化 了 程序 栈 ， 省略 了 除 buffer 和 
currentPosition 之 外 的 局 部 变量 。 根 据 包含 字符 串 的 方 框 来 看 ，buffer 增长 了 
四 次 。 
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buffer 0 


currentPosition | 542 








图 4-6: getLine 函数 的 内 存 分 配 
realloc 函数 也 可 以 用 来 减少 指针 指向 的 内 存 。 为 了 说 明 这 种 用 法 ， 如 下 所 示 的 


七 rim 


函数 会 把 字符 串 中 开头 的 空白 符 删 掉 : 


char* trim(char* phrase) { 


in 


} 


人 


char* old = phrase 
char* new = phrase 


while(*old == ' ') { 
Old++; 
} 
while(*old) { 
*(newt++) = *(old++); 
} 
*new = 0; 


return (char*) realloc(phrase,strlen(phrase)+1); 


main() { 

char* buffer = (char*)malloc(strlen(" cat")+1); 
strcpy(buffer," cat"); 
printf("%s\n",trim(buffer)); 


第 一 个 while 循环 跳 过 开头 的 空白 符 ， 第 二 个 while 循环 把 字符 串 中 剩 下 的 字符 





复 币 
接着 字 


大 小 。 








1 到 字符 串 的 开头 ， 它 的 判断 条 件 一 直 古 真 ， 直 到 遇 到 NUL 字符 ， 就 会 变 成 假 ， 





符 串 末尾 会 添加 0。 然 后 我 们 会 根据 字符 串 的 长 度 用 realloc 函数 调整 内 存 


图 4-7 说 明了 该 函数 接受 " cat" 字符 串 作为 参数 时 的 执行 情况 。 字 符 串 在 trim 国 
数 执行 


前 后 的 状态 如 图 所 示 ， 红 色 框 内 的 内 存 是 旧 内 存 ， 不 应 该 访问 。 























4-7: realloc 示例 


4.5 传递 一 维 数组 

将 一 维 数组 作为 参数 传递 给 函数 实际 是 通过 值 来 传递 数组 的 地 址 ， 这 样 信 息 传递 就 更 
高 效 ， 因 为 我 们 不 需要 传递 整个 数组 ， 从 而 也 就 不 需要 在 栈 上 分 配 内 存 。 通 常 ， 这 
意味 着 要 传递 数组 长 度 ， 否 则 在 国 数 看 来 ， 我 们 只 有 数组 的 地 址 而 不 知道 其 长 度 . 


除非 数组 内 部 有 信息 告诉 我 们 数组 的 边界 ， 否 则 在 传递 数组 时 也 需要 传递 长 度 信息 。 
如 果 数 组 内 存储 的 是 字符 串 ， 我 们 可 以 依赖 NUL 字符 来 判断 何 时 停止 处 理 数组 ， 
第 5 章 会 深入 探讨 这 部 分 内 容 。 一 般 来 说 ， 如 果 不 知道 数组 长 度 ， 就 无 法 处 理 其 元 
素 ， 最 终 导致 的 结果 可 能 是 处 理 的 元 素 太 少 ， 也 可 能 是 把 数组 边界 以 外 的 内 存 当 成 
数组 的 一 部 分 ， 而 这 样 经 常会 造成 程序 非 正常 终止 。 


我 们 可 以 使 用 下 面 两 种 表示 法 中 的 一 种 在 函数 声明 中 声明 数组 : 数组 表示 法 和 指针 
表示 法 。 
























































4.5.1 用 数组 表示 ; 
下 面 的 例子 将 一 个 整数 数组 及 其 长 度 传递 给 函数 ， 并 打印 其 内 容 : 


void displayArray(int arr[], int size) { 
for (int i = 0; i < size; i++) { 
printf("%d\n", arr[il]); 


int vector[5] = {1, 2, 3, 4, 5}; 
displayArray(vector, 5); 


这 有 段 代码 的 输出 是 数字 1 到 5， 我 们 给 函数 传递 5 来 表明 数组 长 度 。 也 可 以 传递 任 
意 正 数 ， 不 管 这 个 长 度 是 否 正确 ， 函 数 都 会 试图 打印 相应 数量 的 元 素 。 尝 试 越过 数 
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组 边界 寻 址 可 能 会 导致 程序 终止 。 本 例 的 内 存 分 配 如 图 4-8 所 示 。 





arr200 | 100 | 
size204 || 5 | 


displayArray 


main | |vector 100 
程序 栈 














图 4-8: 使 用 数组 表示 法 





为 确定 数组 的 元 素数 量 对 数组 使 用 sizeof 操作 符 是 一 种 常见 的 错误 ， 如 
~ 下 所 示 。4.1.1 节 中 已 经 解释 过 了 ， 这 样 获取 长 度 是 不 对 的 。 在 这 种 情况 
下 ， 我 们 给 函数 传递 的 是 20。 

















displayArray(arr, sizeof(arr)); 
还 有 一 种 情况 比较 常见 : 传递 的 元 素数 量 比 数组 中 实际 的 元 素数 量 少 ， 这 样 可 以 处 
理 数 组 的 一 部 分 。 比 如 说 ， 假 设 我 们 读 入 一 系列 年 龄 并 放 进 数组 ， 但 没有 占 满 数组 ， 
此 时 如 果 调 用 sort 函数 来 排序 ， 我 们 希望 只 对 有 效 的 年 龄 进行 排序 ， 而 不 是 数组 
的 所 有 元 素 。 


4.5.2 ”用 指针 表示 法 
声明 函数 的 数组 参数 不 一 定 要 用 方 括 号 表示 法 ， 也 可 以 用 指针 表示 法 ， 如 下 所 示 : 








void displayArray(int* arr, int size) { 
for (int i = 0; i < size; i++) { 
printf("%d\n", arr[i]); 
} 
} 


在 函数 内 部 我 们 仍然 使 用 数组 表示 法 ， 如 果 有 和 需要， 也 可 以 用 指针 表示 法 : 





void displayArray(int* arr, int size) { 
for (int i = 0; i < size; i++) { 
printf("%d\n", *(arr+i)); 
} 
} 


如 果 在 声明 函数 时 用 了 数组 表示 法 ， 在 函数 体内 还 是 可 以 用 指针 表示 法 : 
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void displayArray(int arr[]，int Size) { 
for (int i = 0; i < size; i++) { 
printf("%d\n", *(arr+i)); 
} 
} 


4.6 ”使 用 指针 的 一 维 数 组 


在 本 闻 中 ， 我 们 通过 使 用 整数 指针 的 数组 来 说 明 使 用 指针 数组 的 关键 点 。 指 针 数组 
的 例子 也 出 现在 下 面 几 处 : 


。 3.3.5 节 中 我 们 使 用 了 函数 指针 的 数组 ; 
。 6.1 节 的 “结构 体 的 内 存 如 何 分 配 ” 中 我 们 使 用 了 结构 体 数组 ; 
。 5.3.4 节 中 我 们 处 理 了 argv 数组 。 


本 市 的 目的 是 说 明 这 种 方法 的 本 质 ， 来 为 接 下 来 的 儿 个 例子 打 好 基础 。 下 面 的 代码 
片段 声明 一 个 整数 指针 的 数组 ， 为 每 个 元 素 分 配 内 存 ， 然 后 把 内 存 的 内 容 初始 化 为 
元 素 的 索引 值 : 











int* arr[5]; 
for(int i=0; i<5; i++) { 
arr[il = (int*)malloc(sizeof(int)); 
*arr[i] = i; 
} 
如 果 把 数组 打印 出 来 ， 得 到 的 是 数字 0 到 4。 我 们 用 arr[i] 引用 指针 ， 用 *arr[i] 
把 值 赋 给 指针 引用 的 位 置 。 别 被 数组 表示 法 搞 糊 涂 了 ， 因 为 arr 声明 为 指针 数组 ， 
arr[i] 返回 的 是 一 个 地 址 ， 当 我 们 用 *arr[i] 解 引 指针 时 ， 得 到 是 这 个 地 址 的 内 容 。 


我 们 也 可 以 在 循环 体 中 使 用 下 面 这 种 等 价 的 指针 表示 法 : 








*(arr+i) = (int*)malloc(sizeof(int)); 
**(arrt+i) = i; 





这 种 表示 法 更 难 理解 ， 但 是 理解 以 后 能 加 强 你 的 C 技能 。 在 第 二 个 语句 中 我 们 用 了 
两 层 间接 引用 ， 擎 担 这 种 表示 法 将 让 你 和 初级 C 程序 员 有 本 质 区 别 。 


子 表达 式 (arr+i) 表示 数组 的 第 i 个 元 素 的 地 址 ， 我 们 需要 修改 这 个 地 址 中 的 内 
容 ， 所 以 用 了 子 表达 式 *(arr+i)。 在 第 一 条 语句 中 我 们 将 已 分 配 的 内 存 赋 给 这 个 
位 置 。 对 (arr+i) 子 表达 式 做 两 次 解 引 (如 第 二 条 语句 所 示 )， 会 返回 所 分 配 内 存 
的 位 置 ， 然 后 我 们 把 i 赋 给 它 。 图 4-9 说 明了 内 存 的 分 配 情况 。 
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arr[0] 100 Em 500 
arr[1] 104 | 1 |504 
arr[2] 108 EE 508 
arr[3] 112 | 512 | | 3 1512 
anrt116| 356 3]546 


arr ——> 100 

ar 二 1 一 一 请 104 

*(arr 十 1) ——> 504 
xx(ar + ]) 一 一 1 











图 4-9: 指针 数组 


比如 说 ，arr[1] 位 于 地 址 104， 表 达 式 (arr+1) 为 我 们 返回 104， 用 *(arr+1) 则 
让 我 们 得 到 其 内 容 ， 在 本 例 中 ， 就 是 指针 504。 再 用 **(arr+1) 解 引 它 就 得 到 了 
504 的 内 容 ， 就 是 1。 


表 4-3 中 列 出 了 一 些 示 例 表达 式 。 从 左 到 右 读 指针 表达 式 且 不 要 忽略 括号 ， 这 样 会 
更 容易 理解 其 工作 方式 。 


表 4-3:， 指针 数组 表达 式 

















表达 式 值 
*arr[0] 0 
** rT 0 
** (arrt+l) 1 
arr[0][0] 0 
arr[3][0] 3 


前 三 个 表达 式 和 前 面 解释 的 差不多 ， 最 后 两 个 则 有 所 不 同 。 用 指针 的 指针 表示 法 能 
让 我 们 知道 正在 处 理 的 是 指针 数组 ， 实 际 上 我 们 的 示例 中 也 用 到 了 。 如 果 再 看 一 下 
图 4-9， 假 设 arr 的 每 个 元 素 指向 一 个 长 度 为 1 的 数组 ， 那 么 最 后 两 个 表达 式 就 能 
说 通 了 ， 我 们 得 到 的 是 一 个 有 5 个 元 素 的 指针 数组 ， 这 些 指 针 指 向 一 系列 有 1 个 元 
素 的 数组 。 


表达 式 arr[3][0] 引用 arr 的 第 4 个 元 素 ， 然 后 是 这 个 元 素 所 指向 的 数组 的 第 1 
个 元 素 。 表 达 式 arr[3] [1] 有 错误 ， 因 为 第 4 个 元 素 所 指向 的 数组 只 有 一 个 元 素 。 


个 例子 提醒 我 们 可 以 创建 不 规则 数组 ， 这 确实 行 得 通 ，4.10 闻 讲 的 就 是 这 个 











4.7 ”指针 和 多 维 数组 


可 以 将 多 维 数组 的 一 部 分 看 做 子 数 组 。 比 如 说 ， 二 维 数组 的 每 一 行 都 可 以 当做 一 维 


数组 。 这 种 行为 会 对 我 们 用 指针 处 理 多 维 数组 有 所 影响 。 
为 了 说 明 这 种 行为 ， 我 们 创建 一 个 二 维 数组 并 初始 化 ， 如 下 所 示 : 


int matrix[2][5] = {{1,2,3,4,5},1{6,7,8,9,10}}; 





然后 打印 元 素 的 地 址 和 值 : 


for(int i=0; i<2; i++) { 
for(int j=0; j<5; j++) { 
printf("matrix[%d][%d] Address: %p Value: %d\n", 
i, j, Smatrix[i][j], matrix[i][j]); 
} 
} 


输出 如 下 所 示 : 


matrix[0][0] Address: 100 Value: 
matrix[0][1] Address: 104 Value: 
matrix[0][2] Address: 108 Value: 
matrix[0][3] Address: 112 Value: 
matrix[0][4] Address: 116 Value: 
matrix[1][0] Address: 120 Value: 
matrix[1][1] Address: 124 Value: 
matrix[1][2] Address: 128 Value: 
matrix[1][3] Address: 132 Value: 
matrix[1][4] Address: 136 Value: 


POO~OUUPOWUON Pc 


数组 按 行 - 列 顺序 存储 ， 也 就 是 说 ， 将 第 一 行 按 顺序 存 人 内 存 ， 后 面 紧 接着 


内 存 分 配 如 图 4-10 所 示 。 


a 7 i ee 


宦 一 位。 





matrix[0] 
matrix[0][ 
matrix[0][ 
matrix[0][ 
matrix[0][ 
matrix[1][ 
matrix[1][ 
matrix[1] 
matrix[1][ 
matrix[1] 

















4-10: 二 维 数组 的 内 存 分 配 
我 们 可 以 声明 一 个 指针 处 理 这 个 数组 ， 如 下 所 示 : 





已 
日 
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int (*pmatrix)[5] = matrix; 
(*pmatrix) 表达 式 声明 了 一 个 数组 指针 ， 上 面 的 整 条 声明 语句 将 pmatrix 定义 为 
一 个 指向 二 维 数组 的 指针 ， 该 二 维 数 组 的 元 素 类 型 是 整数 ， 每 行 有 5 个 元 素 。 如 果 
我 们 把 括号 去 掉 就 声明 了 5 个 元 素 的 数组 ， 数 组 元 素 的 类 型 是 整数 指针 。 如 果 声 明 
的 列 数 不 是 5， 用 该 指针 访问 数组 的 结果 则 是 不 可 预期 的 。 


如 果 要 用 指针 表示 法 访问 第 二 个 元 素 (就 是 2)， 下 面 的 代码 看 似 合理 : 











printf("%p\n", matrix); 
printf("%p\n", matrix + 1); 





但 输出 却 是 : 


matrix+1 返回 的 地 址 不 是 从 数组 开头 偏 移 了 4， 而 是 偏 移 了 第 一 行 的 长 度 ，20 字 
节 。 用 matrix 本 身 返 回 数组 第 一 个 元 素 的 地 址 ， 二 维 数组 是 数组 的 数组 ， 所 以 我 
们 得 到 是 一 个 拥有 5 个 元 素 的 整数 数组 的 地 址 ， 它 的 长 度 是 20。 我 们 可 以 用 下 面 的 
语句 验证 这 一 点 ， 它 会 打印 出 20: 








printf("%d\n",sizeof (matrix[0])); // 显示 20 


要 访问 数组 的 第 二 个 元 素 ， 需 要 给 数组 的 第 一 行 加 上 1， 像 这 样 : *(matrix[0] + 1)。 
表达 式 matrix[0] 返回 数组 第 一 行 第 一 个 元 素 的 地 址 ， 这 个 地 址 是 一 个 整数 数组 的 
地 址 ， 于 是 ， 给 它 加 1 实际 加 上 的 是 一 个 整数 的 长 度 ， 得 到 的 是 第 二 个 元 素 。 输 出 
结果 是 104 和 2。 





printf("%p %d\n", matrix[0] + 1, *(matrix[0] + 1)); 


我 们 可 以 用 图 文 的 形式 来 说 明 数 组 ， 如 图 4-11 所 示 。 


mt | — 7 TT 
ma ee 


4-11: 二 维 数组 图 示 

















图 4-12 可 以 解释 二 维 数组 表示 法 。 





arr[i][j] 


address of arr + (i* size of row) + (j * size of element) 








4-12: 二 维 数 组 表示 法 
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4.8 传递 多 维 数组 


给 函数 传递 多 维 数组 很 容易 让 人 迷惑 ， 尤 其 是 在 用 指针 表示 法 的 情况 下 。 传 递 多 维 
数组 时 ， 我 们 要 决定 在 函数 签名 中 使 用 数组 表示 法 还 是 指针 表示 法 。 还 有 一 件 要 
考虑 的 事情 是 如 何 传递 数组 的 形态 ， 这 里 所 说 的 形态 是 指数 组 的 维 数 及 每 一 维 的 大 
小 。 要 想 在 函数 内 部 使 用 数组 表示 法 ， 必 须 指定 数组 的 形态 ， 否 则 ， 编 译 器 就 无 法 
使 用 下 标 。 


要 传递 数组 matrix， 可 以 这 么 写 : 





void display2DArray(int arr[][5], int rows) { 
或 者 这 么 写 : 

void display2DArray(int (*arr)[5], int rows) { 
这 两 种 写法 都 指明 了 数组 的 列 数 ， 这 很 有 必要 ， 因 为 编译 器 需要 知道 每 行 有 几 个 元 
素 。 如 果 没 有 传递 这 个 信息 ， 编 译 器 就 无 法 计算 4.7 节 讲 到 的 arr[0][3] 这 样 的 表 
达 式 。 


在 第 一 种 写法 中 ， 表 达 式 arr[] 是 数组 指针 的 一 个 隐 式 声明 ， 而 第 二 种 写法 中 的 
(*arr) 表达 式 则 是 指针 的 一 个 显 式 声明 。 








下 面 的 声明 是 错误 的 : 
-E> void display2DArray(int *arr[5], int rows) { 


尽管 不 会 产生 语法 错误 ， 但 是 函数 会 认为 传 入 的 数组 拥有 5 个 整数 指针 。 
4.6 节 讨 论 了 指针 数组 。 











这 个 函数 的 简单 实现 和 调用 方法 如 下 : 
void display2DArray(int arr[][5], int rows) { 
for (int i = 0; i<rows; i++) { 
for (int j = 0; j<5; j++) { 
printf("%d", arr[i][j]); 
} 
printf("\n"); 
} 


void main() { 
int matrix[2][5] = { 





注 1: 函数 签名 是 指 函数 原型 声明 。 一 一 译 者 注 
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{li 2 3 25]5 
{6, 7, 8, 9, 10} 
拘 
display2DArray (matrix, 2); 
3 


半数 不 会 为 这 个 数组 分 配 内 存 ， 传 递 的 只 是 地 址 。 本 次 调用 的 程序 栈 状态 如 图 4-13 
所 示 。 








display2DArray 


main matrx 100 [1T2TSTaTs ToT7TsTsTrd) | 














图 4-13: 传递 多 维 数组 
你 可 能 会 遇 到 下 面 这 样 的 函数 ， 接 受 的 参数 是 一 个 指针 和 行列 数 : 





void display2DArrayUnknownSize(int *arr, int rows, int cols) { 
for(int i=0; i<rows; i++) { 
for(int j=0; j<cols; j++) { 
printf("%d ", *(arr + (i*cols) + j)); 


} 
printf("\n"); 
} 


printf 语句 通过 给 arr 加 上 前 面 行 的 元 素数 (i*cols) 以 及 表示 当前 列 的 j 来 计 
算 每 个 元 素 的 地 址 。 要 调用 这 个 函数 可 以 这 么 写 : 

















display2DArrayUnknownSize(&matrix[0][0], 2, 5); 


在 函数 内 我 们 无 法 像 下 面 这 样 使 用 数组 下 标 : 








printf("%d ", arr[i][j]); 





原因 是 没有 将 指针 声明 为 二 维 数组 。 不 过 ， 倒 是 可 以 像 下 面 这 样 使 用 数组 表示 法 。 
我 们 可 以 用 一 个 下 标 ， 这 样 写 只 是 解释 为 数组 内 部 的 偏 移 量 ， 不 能 用 两 个 下 标 是 因 
为 编译 器 不 知道 一 维 的 长 度 : 





printf("%d ", (arr+i)[j]); 
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这 里 传递 的 是 snmatrix[0][0] 而 不 是 matrix， 尽 管用 matrix 也 能 运行 ， 但 是 会 
产生 编译 警告 ， 原 因 是 指针 类 型 不 兼容 。&matrix[0][0] 表达 式 是 一 个 整数 指针 ， 








而 matrix 则 是 一 个 整数 数组 的 指针 。 


在 传递 二 维 以 上 的 数组 时 ， 除 了 第 一 维 以 外 ， 需 要 指定 其 他 维度 的 长 度 。 下 面 这 个 


函数 打印 一 个 三 维 数组 ， 声 明 中 指定 了 数组 的 后 二 维 。 


void display3DArray(int (*arr)[2][4], int rows) { 
for(int i=0; i<rows; i++) { 
for(int j=0; j<2; j++) { 
printf("{"); 
for(int k=0; k<4; k++) { 
printf("%d ", arr[i][j][k]); 


} 
printf("}"); 
} 
printf("\n"); 
} 
下 面 说 明 如 何 调 用 这 个 函数 : 
int arr3d[3][2][4] = { 
{{1, 2, 3, 4}, {5, 6, 7, 8}}, 
{{9, 10, 11, 12}, {13, 14, 15, 16}}, 
{{17, 18, 19, 20}, {21, 22, 23, 24}} 
Fs 
display3DArray (arr3d,3); 
输出 如 下 所 示 : 
{1234}{5678} 


{9 10 11 12 }{13 14 15 16 } 
{17 18 19 20 }{21 22 23 24 } 


数组 的 内 存 分 配 如 图 4-14 所 示 。 








arr3d[0][0][0] 1 
arr3d[0][OJ[1] 1 
arr3d[0][0][2] 1 
arr3d[0][01[3] 1 
arr3d[0][1][0] 1 
arr3d[0][1][1 1 








arr3d[2][1][3] 192 








图 4-14: 三 维 数组 
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arr3d[1] 表达 式 引 用 数组 的 第 二 行 ， 是 一 个 2 行 4 列 的 二 维 数组 的 指针 。 
arr3d[1][9] 引用 数组 的 第 二 行 第 一 列 ， 是 一 个 长 度 为 4 的 一 维 数组 的 指针 。 


4.9 动态 分 配 二 维 数组 
为 二 维 数组 动态 分 配 内 存 涉及 几 个 问题 : 
。 数组 元 素 是 否 需 要 连续 ; 
。 数组 是 否 规则 。 
一 个 声明 如 下 的 二 维 数组 所 分 配 的 内 存 是 连续 的 : 
int matrix[2][5] = {{1,2,3,4,5},{6,7,8,9,10}}; 
不 过 ， 当 我 们 用 malloc 这 样 的 国 数 创建 二 维 数组 时 ， 在 内 存 分 配 上 会 有 几 种 选择 。 
由 于 我 们 可 以 将 二 维 数组 当做 数组 的 数组 ， 因 而 “内 层 ” 的 数组 没有 理由 一 定 要 是 
连续 的 。 如 果 对 这 种 数组 使 用 下 标 ， 数 组 的 不 连续 对 程序 员 是 透明 的 。 


























判 内 存 等 其 他 操作 ， 内 存 不 连续 就 可 能 需要 多 次 复制 。 

















4.9.1 分 配 可 能 不 连续 的 内 存 
下 面 的 代码 演示 了 如 何 创建 一 个 内 存 可 能 不 连续 的 二 维 数组 。 首 先 分 配 “ 外 层 ” 数 
组 ， 然 后 分 别 用 malloc 语句 为 每 一 行 分 配 。 


int rows = 2; 
int columns = 5; 


int **matrix = (int **) malloc(rows * sizeof(int *)); 
for (int i = 0; i < rows; i++) { 


matrix[i] = (int *) malloc(columns * sizeof(int)); 


} 


因为 分 别 用 了 maLLoc， 所 以 内 存 不 一 定 是 连续 的 ， 如 图 4-15 所 示 。 














main 











图 4-15: 不 连续 分 配 
实际 的 分 配 情 况 取 决 于 堆 管 理 器 和 堆 的 状态 ， 也 有 可 能 是 连续 的 。 


4.9.2 ”分配 连 续 内 存 
我 们 会 展示 为 二 维 数 组 分 配 连 续 内 存 的 两 种 方法 。 第 一 种 首先 分 配 “ 外 层 ” 数 组 ， 
然后 是 各 行 所 需 的 所 有 内 存 。 第 二 种 一 次 性 分 配 所 有 内 存 。 


下 面 的 代码 片段 演示 了 第 一 种 技术 ， 第 一 个 malloc 分配 了 一 ee 
一 个 元 素 用 来 存储 一 行 的 指针 ， 这 就 是 图 4-16 中 在 地 址 500 处 分 配 的 内 存 块 。 

二 个 malloc 在 地 址 600 sed 分 配 内 存 。 在 for 循环 中 ， ee 
malloc 所 分 配 的 内 存 的 一 部 分 赋值 给 第 一 个 数组 的 每 个 元 素 。 











int rows = 2; 
int columns = 5; 
Int **matrix = (int **) malloc(rows * Sizeof(int *)); 


matrix[0] = (int *) malloc(rows * columns * sizeof(int)); 
for (int i = 1; i < rows; i++) 
matrix[i] = matrix[0] + i * columns; 





main 














4-16: 用 两 次 malloc 调用 分 配 连续 内 存 
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从 技术 上 讲 ， 第 一 个 数组 的 内 存 可 以 和 数组 “ 体 ” 的 内 存 分 开 ， 为 数组 “ 体 ” 分 配 
的 内 存 是 连续 的 。 


下 面 是 第 二 种 技术 ， 数 组 所 需 的 所 有 内 存 是 一 次 性 分 配 的 : 


int *matrix = (int *)malloc(rows * columns * sizeof (int)); 


分 配 的 情况 如 图 4-17 所 示 。 




















图 4-17: 用 一 次 malloc 调用 分 配 连续 内 存 


后 面 的 代码 用 到 这 个 数组 时 不 能 使 用 下 标 ， 必 须 手动 计算 索引 ， 如 下 代码 片段 所 示 。 
每 个 元 素 被 初始 化 为 其 索引 的 积 





for (int i = 0; i < rows; i++) { 
for (int j = 0; j < columns; j++) { 
*(matrix + (i*columns) + j) = i*j; 
} 
3 
不 能 使 用 数组 下 标 是 因为 我 们 丢失 了 允许 编译 器 使 用 下 标 所 需 的 “形态 ”信息 。 这 
个 概念 在 4.8 节 讲 过 了 。 


实际 项 目 中 很 少 使 用 这 种 方法 ， 但 它 确实 说 明了 二 维 数组 概念 和 内 存 的 一 维 本 质 的 
关系 。 便 捷 的 二 维 数组 表示 法 让 这 种 映射 变 得 透明 且 更 容易 使 用 。 


我 们 已 经 演示 了 为 二 维 数组 分 配 连 续 内 存 的 两 种 方法 ， 具 体 使 用 哪 种 要 看 应 用 程序 
的 需要 。 不 过 第 二 种 方法 是 为 “整个 ”数组 分 配 一 块 内 存 。 


4.10 人 


不 规则 数组 是 每 一 行 的 列 数 不 一 样 的 二 维 数组 ， 其 原理 如 图 4-18 所 示 ， 图 中 的 数组 
psp a 

















96 | 第 4 章 





行 
1 2 3 


0 
画面 医 国 原 马莉 图 
列 1 
are 
图 4-18: 不 规则 数组 


在 了 解 如 何 创 建 不 规则 数组 之 前 ， 让 我 们 先 看 一 下 用 复合 字面 量 创建 的 二 维 数组 。 
复合 字面 量 是 一 种 C 构造 ， 前 面 看 起 来 像 类 型 转换 操作 ， 后 面 跟 着 花 括号 括 起 来 的 
初始 化 列表 。 下 面 是 整数 常量 和 整数 数组 的 例子 ， 我 们 将 其 作为 声明 的 一 部 分 : 


(const int) {100} 
(int[3]) {10, 20, 30} 




















下 面 的 声明 把 数组 声明 为 整数 指针 的 数组 ， 然 后 用 复合 字面 量 语句 块 进行 初始 化 ， 
由 此 创建 了 数组 arrl。 
int (*(arrl[])) = { 
(int[]) {90, 1, 2}, 


(int[]) {3, 4, 5}, 
(int[]) {6, 7 


这 个 数组 有 3 行 3 列 ， 将 数组 元 素 用 数字 0 到 8 按 行 - 列 顺序 初始 化 。 图 4-19 说 明 
了 数组 的 内 存 布局 。 








arr] 
arr1[0][1 
arr1[ 
arr1 
arr1[ 
arr1[ 
arr1[ 
arr1[ 
arr1 


























4-19; 二 维 数组 
下 面 的 代码 片段 打印 每 个 数组 元 素 的 地 址 和 值 : 


for(int j=0; j<3; j++) { 
for(int i=0; i<3; i++) { 
printf("arrl[%d] [%d] Address: %p Value: %d\n", 
j, i, &arrl[j][il], arrl[j][i]); 


} 
printf("\n"); 
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执行 后 会 得 到 如 下 输出 : 


arrl[0][0] Address: 0x100 Value: 0 
arrl[0][1] Address: 0x104 Value: 1 
arrl[0][2] Address: 0x108 Value: 2 


上 二 


arrl[1][0] Address: Ox112 Value: 3 
arrl[1][1] Address: 0x116 Value: 4 
arrl[1][2] Address: 0x120 Value: 5 


arrl[2][0] Address: 0x124 Value: 6 
arrl[2][1] Address: 0x128 Value: 7 
arrl[2][2] Address: 0x132 Value: 8 


稍微 修改 一 下 声明 就 可 以 得 到 一 个 不 规则 数组 ， 就 是 图 4-18 中 展示 的 那个 。 数 组 声 
明 如 下 : 





int (*(arr2[])) = { 
(int[]) {0, 1, 2, 3}, 
(int[]) {4, 5}, 
(int[]) {6, 7, 8}}; 
我 们 用 了 3 个 复合 字面 量 声明 不 规则 数组 ， 然 后 从 0 开始 按 行 - 列 顺序 初始 化 数组 
元 素 。 下 面 的 代码 片段 会 打印 数组 来 验证 创建 是 否 正确 ， 因 为 每 行 的 列 数 不 同 ， 所 
以 需要 3 个 for 循环 : 








int row = 0; 
for(int i=0; i<4; i++) { 
printf("layerl[%d][%d] Address: %p Value: %d\n", 
row, i, &arr2[row][il], arr2[row][i]); 
3 
printf("\n"); 


row = 1; 
for(int i=0; i<2; i++) { 
printf("layerl[%d][%d] Address: %p Value: %d\n", 
row, i, &arr2[row][il], arr2[row][i]); 
} 
printf("\n"); 


FOW .12.3 
for(int i=0; i<3; i++) { 
printf("layerl[%d][%d] Address: %p Value: %d\n", 
row, i, &arr2[row][i], arr2[row][i]); 


} 
printf("\n"); 
输出 如 下 : 


arr2[0][0] Address: 0x000100 Value: 0 
arr2[0][1] Address: 0x000104 Value: 1 





太后 
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arr2[0][2] 
arr2[0][3] 


arr2[1][0] 
arr2[1][1] 


arr2[2][0] 
arr2[2][1] 
arr2[2][2] 





Address : 
Address: 


Address: 
Address: 


Address: 
Address: 
Address: 


Ox000108 Value: 2 
0x000112 Value: 3 


Ox000116 Value: 4 
0x000120 Value: 5 


0x000124 Value: 6 
0x000128 Value: 7 
0x000132 Value: 8 


图 4-20 说 明了 这 个 数组 的 内 存 布局 。 








arr2[0] 
arr2[0] 
arr2[0] 
arr2[0] 
arr2[1] 
arr2[1] 
arr2[2] 
arr2[2] 
arr2[2] 

















图 4-20: 不 规则 数组 的 内 存 分 配 

在 这 些 例子 中 ， 我 们 访问 数组 内 容 时 用 的 是 数组 表示 法 而 不 是 指针 表示 法 ， 这 样 更 
易 读 ， 也 好 理解 。 不 过 ， 也 可 以 用 指针 表示 法 。 

复合 字面 量 在 创建 不 规则 数组 时 很 有 用 ， 不 过 访问 不 规则 数组 的 元 素 比较 别扭 ， 上 
面 的 例子 就 用 了 3 个 for 循环 。 如 果 有 一 个 单独 的 数组 来 维护 每 行 的 长 度 ， 那 么 这 
个 例子 就 可 以 简化 。 你 可 以 在 C 中 创建 不 规则 数组 ， 不 过 要 考虑 好 它 能 起 的 作用 是 


否 值 得 花费 相应 的 精力 。 


4.11 小结 


本 章 首先 简 述 了 数组 ， 然 后 研究 了 数组 表示 法 和 指针 表示 法 的 异同 。 我 们 可 以 使 用 
malloc 类 函数 创建 数组 ， 这 类 函数 提供 了 比 传 统 数组 声明 更 大 的 灵活 性 。 我 们 也 
学 习 了 如 何 用 realloc 函数 调整 数组 的 内 存 。 

为 数组 动态 分 配 内 存 可 能 会 比较 难 ， 对 于 二 维 或 多 维 数组 ， 我 们 得 小 心 确保 数组 分 
配 在 连续 的 内 存 上 。 


我 们 也 探索 了 在 传递 和 返回 数组 时 可 能 产生 的 问题 ， 通 常 需要 给 函数 传递 数组 长 度 


以 便 函 数 能 正确 处 再 















































数组 。 我 们 还 研究 了 如 何在 C 中 创建 不 规则 数组 。 
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第 5 章 


指针 和 字符 串 





字符 串 可 以 分 配 在 内 存 的 不 同 区域 ， 通 常 使 用 指针 来 支持 字符 串 操 作 。 指 针 支 持 动 
态 分 配 字符 串 和 将 字符 串 作 为 参数 传递 给 函数 。 深 入 理解 指针 及 指针 与 字符 串 结 合 
的 用 法 可 以 让 程序 员 开发 出 有 效 而 且 高 效 的 应 用 程序 。 


字符 串 是 很 多 应 用 程序 的 常见 组 成 部 分 ， 也 是 一 个 复杂 的 主题 。 在 本 章 中 ， 我 们 会 
探索 声明 和 初始 化 字符 串 的 不 同方 法 ,研究 C 程序 中 字面 量 池 的 使 用 及 其 影响 。 此 
外 ， 我 们 还 会 看 到 比较 、 复 制 和 拼接 字符 串 等 常见 字符 串 操作 。 

字符 串通 常 以 字符 指针 的 形式 传递 给 函数 和 从 函数 返回 。 我 们 可 以 用 字符 指针 传递 
字符 串 ， 也 可 以 用 字符 常量 的 指针 传递 字符 串 ， 后 者 可 以 避免 字符 串 被 函数 修改 。 
本 章 用 到 的 很 多 例子 能 更 好 地 说 明 第 3 章 中 提 到 的 原理 ， 不 同 之 处 在 于 本 章 的 例子 
无 需 将 长 度 传递 给 函数 。 

我 们 也 可 以 从 国 数 返回 字符 串 ， 从 而 满足 某 个 请 求 。 可 以 将 这 个 字符 串 从 外 面 传 给 
国 数 并 由 国 数 修 改 ， 也 可 以 在 国 数 内 部 分 配 ， 还 可 以 返回 静态 分 配 的 字符 串 。 本 章 
会 逐一 探讨 这 些 方法 。 


我 们 也 会 研究 函数 指针 的 用 法 以 及 如 何 用 函数 指针 辅助 排序 操作 。 理 解 这 些 情况 下 
指针 如 何 工 作 是 本 音 关 注 的 重点 。 


5.1 字符 串 基础 


字符 串 是 以 ASCII 字符 NUL 结尾 的 字符 序列 。ASCII 字符 NUL 表示 为 \9。 字 符 串 




















101 


通常 存储 在 数组 或 者 从 堆 上 分 配 的 内 存 中 。 不 过 ， 并 非 所 有 的 字符 数组 都 是 字符 串 ， 
字符 数组 可 能 没有 NUL 字符 。 字 符 数组 也 用 来 表示 布尔 值 等 小 的 整数 单元 ， 以 市 省 
内 存 空间 。 


C 中 有 两 种 类 型 的 字符 串 。 





> 大 太 


。 单字 节 字 符 囊 
由 char 数据 类 型 组 成 的 序列 。 


。 宽 字 符 串 
由 wchar _t 数据 类 型 组 成 的 序列 。 


wchar tt 数据 类 型 用 来 表示 宽 字 符 ， 要 么 是 16 位 宽 ， 要 么 是 32 位 宽 。 这 两 种 字符 
串 都 以 NUL 结尾 。 可 以 在 string.h 中 找到 单字 节 字 符 串 国 数 ， 而 在 wchar.h 中 找到 
宽 字符 串 函 数 。 除 非特 别 指明 ， 本 章 用 到 的 都 是 单字 节 字 符 串 。 创 建 宽 字符 主要 用 
来 支持 非 拉丁 字符 集 ， 对 于 支持 外 语 的 应 用 程序 很 有 用 。 


字符 串 的 长 度 是 字符 串 中 除了 NUL 字符 之 外 的 字符 数 。 为 字符 串 分 配 内 存 时 ， 要 记 
得 为 所 有 的 字符 再 加 上 NUL 字符 分 配 足 够 的 空间 。 





























记 住 ，NULL 和 NUL 不 同 。NULL 用 来 表示 特殊 的 指针 ， 通 常 定义 为 ( (void*)0)， 
一 CE 而 NUL 是 一 个 char, 定义 为 \9， 两 者 不 能 混用 。 











字符 常量 是 单 引号 引起 来 的 字符 序列 。 字 符 常量 通常 由 一 个 字符 组 成 ， 也 可 以 包含 
多 个 字符 ， 比 如 转 义 字符 。 在 C 中 ， 它 们 的 类 型 是 int， 如 下 所 示 ;: 





printf("%d\n",sizeof(char)); 
printf("%d\n",sizeof('a')); 


执行 上 述 代 码 可 以 看 到 char 的 长 度 是 1， 而 字符 字面 量 的 长 度 是 4。 这 个 看 似 异 常 
的 现象 乃 语言 设计 者 有 意 为 之 。 


5.1.1 字符 串 声明 

声明 字符 串 的 方式 有 三 种 : 字面 量 、 字 符 数组 和 字符 指针 。 字 符 串 字面 量 是 用 双 引 
号 引起 来 的 字符 序列 ， 常 用 来 进行 初始 化 ， 它 们 位 于 字符 串 字 面 量 池 中 ， 我 们 会 在 
下 一 节 讨论 。 

不 要 把 字符 串 字 面 量 和 单 引号 引起 来 的 字符 搞 混 一 后 者 是 字符 字面 量 。 在 后 面 的 
各 节 我 们 会 看 到 ， 把 字符 字面 量 当做 字符 串 字面 量 用 会 出 问题 ，。 





























下 面 是 一 个 字符 数组 的 例子 ， 我 们 声明 了 一 个 header 数组 ， 最 多 可 以 持 有 31 个 字 
符 。 因 为 字符 串 需 要 以 NUL 结尾 ， 所 以 如 果 我 们 声明 一 个 数组 拥有 32 个 字符 ， 那 
么 只 能 用 31 个 元 素来 保存 实际 字符 串 的 文本 。 字 符 串 在 内 存 中 的 位 置 取决 于 声明 的 
位 置 ， 我 们 会 在 5.1.3 节 中 探究 这 个 问题 。 








char header[32]; 


字符 指针 如 下 所 示 ， 由 于 没有 初始 化 ， 也 就 没有 引用 字符 串 ， 当 前 还 没有 指定 字符 
串 的 长 度 和 位 置 。 


char *header; 


5.1.2 ”字符 串 字面 量 ; 

定义 字面 量 时 通常 会 将 其 分 配 在 字面 量 池 中 ， 这 个 内 存 区 域 保 存 了 组 成 字符 串 的 字符 
序列 。 多 次 用 到 同一 个 字面 量 时 ， 字 面 量 池 中 通常 只 有 一 份 副本 。 这 样 会 减少 应 用 程 
序 占 用 的 内 存 。 通 常 认 为 字面 量 是 不 可 变 的 ， 因 此 只 有 一 份 副本 不 会 有 什么 问题 。 不 
过 ,认定 只 有 一 份 副 本 或 者 字面 量 不 可 变 不 是 一 种 好 做 法 ， 大 部 分 编译 器 有 关闭 字面 
量 凶 的 选项 ， 一 旦 关闭 ， 字 面 量 可 能 生成 多 个 副本 ， 每 个 副本 拥有 自己 的 地 址 。 











:A 
， 
、 


GCC 用 -fwritable-strings 选项 来 关闭 字符 串 池 。 在 Microsoft Visual 
。Studio 中 ，/GF 选项 会 打开 字符 串 池 。 
PY 

















图 5-1 说 明了 字面 量 池 的 内 存 分 配方 式 。 


“Media Player” 字符 串 字面 量 池 














图 5-1: 字符 串 字面 量 池 


字符 串 字面 量 一 般 分 配 在 只 读 内 存 中 ， 所 以 是 不 可 变 的 。 字 符 串 字面 量 在 哪里 使 用 ， 
或 者 它 是 人 全局、 静态 或 局 部 的 都 无 关 紧 要 ， 从 这 个 角度 讲 ， 字 符 串 字面 量 不 存在 作 
用 域 的 概念 。 
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字符 串 字 面 量 不 是 常量 的 情况 


在 大 部 分 编译 器 中 ， 我 们 将 字符 串 字面 量 看 做 常量 ， 无 法 修改 字符 串 。 不 过 ， 在 有 
些 编译 器 中 〈 比 如 GCC)， 字 符 串 字面 量 是 可 修改 的 。 看 下 面 这 个 例子 : 








char *tabHeader = "Sound"; 

*tabHeader = 'L'; 

printf("%s\n",tabHeader); // 打印 "Lound" 
这 样 会 把 字面 量 改 成 "Lound"， 这 通常 不 是 我 们 期 望 的 结果 ， 因 此 应 该 避免 这 么 
做 。 像 下 面 这 样 把 变量 声明 为 常量 可 以 解决 一 部 分 问题 。 任 何 修改 字符 串 的 尝试 都 
会 造成 编译 时 错误 : 





























const char *tabHeader = "Sound"; 


5.1.3 字符 串 初始 化 

初始 化 字符 串 采 用 的 方法 取决 于 变量 是 被 声明 为 字符 数组 还 是 字符 指针 ， 字 符 串 所 
用 的 内 存 要 么 是 数组 要 么 是 指针 指向 的 一 块 内 存 。 我 们 可 以 用 字符 串 字面 量 或 者 一 
系列 字符 初始 化 字符 串 ， 或 者 从 别 的 地 方 〈 比 如 说 标准 输入 ) 得 到 字符 。 接 下 来 我 
们 会 研究 这 些 方法 。 


1. 初始 化 char 数 组 


我 们 可 以 用 初始 化 操作 符 初 始 化 char 数组 。 在 下 例 中 ，header 数组 被 初始 化 为 字 
符 串 字面 量 中 所 包含 的 字符 : 








char header[] = "Media Player"; 
字面 量 "Media Player" 的 长 度 为 12 个 字符 ， 表示 这 个 字面 量 需 要 13 字 节 ， 我 们 
就 为 数组 分 配 了 13 字 节 来 持 有 字符 串 。 初 始 化 操作 会 把 这 些 字符 复制 到 数组 中 ， 以 
NUL 结尾 ， 如 图 5-2 所 示 ， 这 里 假设 在 main 函数 中 声明 数组 。 
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5-2: 初始 化 char 数组 
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我 们 也 可 以 用 strcpy 函数 初始 化 数组 ，5.2.2 节 会 详细 讨论 strcpy。 下 面 的 代码 
片段 将 字符 串 字面 量 复制 到 了 数组 中 。 





char header[13]; 
strcpy(header, "Media Player"); 


更 条 的 办 法 是 把 字符 逐个 赋 给 数组 元 素 ， 如 下 所 示 : 


header[0] 
header[1] 


'M'; 
'e' 


header[12] = '\0'; 





F 面 的 赋值 是 不 合法 的 ， 我 们 不 能 把 字符 串 字 面 量 的 地 址 赋 给 数组 名 字 。 


-> char header2[]; 


header2 = "Media Player"; 











2. 初始 化 char 指 针 
动态 内 存 分 配 可 以 提供 更 多 的 灵活 性 ， 当 然 也 可 能 会 让 内 存 存 在 得 更 久 。 下 面 的 声 
明 用 来 说 明 这 种 技术 : 

char *header; 


初始 化 这 个 字符 串 的 常见 方法 是 使 用 maLLtoc 和 strcpy 函数 分 配 内 存 并 将 字面 量 
复制 到 字符 串 中 ， 如 下 所 示 : 


char *header = (char*) malloc(strlen("Media Player")+1); 
strcpy (header, "Media Player"); 


假设 这 段 代码 在 main 函数 中 ， 图 5-3 显示 了 程序 栈 的 状态 。 


600IM[eldjilal jplUalylelrlol | 字符 串 字面 量 池 








main 00 














5-3: 初始 化 char 指针 





前 面 用 到 malloc 函数 的 地 方 ， 我 们 对 字符 串 字面 量 使 用 了 strlen 函数 ， 也 可 以 
如 下 所 示 明 确 指 定 长 度 : 
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char *header = (char*) malloc(13); 











在 决定 malloc 函数 要 用 到 的 字符 串 长 度 时 ， 要 注意 以 下 事项 。 

ED 

。 不 要 用 sizeof 操作 符 ， 而 是 用 strlen 函数 来 确定 已 有 字符 串 的 长 度 。 
sizeof 操作 符 会 返回 数组 和 指针 的 长 度 ， 而 不 是 字符 串 的 长 度 。 
































如 果 不 用 字符 串 字面 量 和 strcpy 函数 初始 化 字符 串 ， 我 们 也 可 以 这 么 做 : 


*(header + 0) = 'M'; 
*(header + 1) = 'e'; 
*(header + 12) = '\0'; 





我 们 可 以 将 字符 串 字 面 量 的 地 址 直接 赋 给 字符 指针 ， 如 下 所 示 。 不 过 ， 这 样 不 会 产 
生字 符 串 的 副本 ， 如 图 5-4 所 示 。 


char *header = "Media Player"; 


BEETETTETEDTETH | 字符 囊 字面 量 池 
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图 5-4: 复制 字符 串 字 面 量 的 地 址 到 指针 中 




















试图 用 字符 字面 量 来 初始 化 char 指针 不 会 起 作用 。 因 为 字符 字面 量 是 
一 人 int 类 型 ， 这 其 实 是 尝试 把 整数 赋 给 字符 指针 。 这 样 经 常会 造成 应 用 程序 
在 解 引 指针 时 终止， 


char* prefix = '+'; // 不 合法 


正确 的 做 法 是 像 下 面 这 样 用 malloc 国 数 : 




















prefix = (char*)malloc(2); 
*prefix = '+'; 
*(prefix+1) = 0; 


3. 从 标准 输入 初始 化 字符 串 
也 可 以 用 标准 输入 等 外 部 源 初始 化 字符 串 。 不 过 ， 在 从 标准 输入 读 入 字符 串 时 可 能 








-A 
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会 出 错 ， 下 面 是 个 例子 。 这 里 会 出 问题 是 因为 我 们 在 使 用 command 变量 之 前 没有 为 
其 


char *command; 
printf("Enter a Command: "); 
scanf("%s",command); 


要 解决 这 个 问题 需要 首先 为 指针 分 配 内 存 ， 或 者 用 定 长 数组 代替 指针 。 不 过 ， 用 户 
输入 的 数据 可 能 比 我 们 所 能 装 下 的 要 多 ， 第 4 章 讨 论 了 更 健壮 的 方法 。 


4. 字符 串 位 置 小 结 


我 们 可 能 将 字符 串 分 配 在 几 个 地 方 ， 下 例 解 释 了 几 种 可 能 的 变化 ， 图 5-5 说 明了 这 
些 字符 串 在 内 存 中 的 布局 。 











char* globalHeader = "Chapter"; 
char globalArrayHeader[] = "Chapter"; 


void displayHeader() { 


static char* staticHeader = "Chapter"; 
char* localHeader = "Chapter"; 
static char staticArrayHeader[] = "Chapter"; 


char localArrayHeader[] = "Chapter"; 
char* heapHeader = (char*)malloc(strlen("Chapter")+1); 
strcpy(heapHeader, "Chapter"); 


下 
回回 日 中 口中 闭 a 
Ct 




















全 局 内 存 


displayHeader 


main 














图 5-5: 字符 串 的 内 存 分 配 
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知道 字符 串 存 储 的 位 置 对 理解 程序 的 工作 原理 以 及 用 指针 访问 字符 串 有 帮助 。 字 符 
串 的 位 置 决定 它 能 存在 多 和 久 ， 以 及 程序 的 哪些 部 分 可 以 访问 它 。 比 如 说 ， 分 配 在 全 
局 内 存 的 字符 串 会 一 直 存 在 ， 也 可 以 被 多 个 函数 访问 ， 静 态 字符 串 也 一 直 存 在 ， 不 
过 只 有 定义 它们 的 国 数 才能 访问 ， 分 配 在 堆 上 的 内 存在 释放 之 前 会 一 直 存 在 ， 也 可 
以 被 多 个 函数 访问 。 理 解 这 些 东 西 能 让 你 作出 更 好 的 选择 。 


5.2 标准 字符 串 操 作 

在 本 节 中 ， 我 们 会 研究 指针 在 常见 字符 串 操作 中 的 使 用 ， 包 括 比较 、 复 制 和 拼接 。 
5.2.1 比较 字符 串 

字符 串 比 较 是 应 用 程序 不 可 分 割 的 一 部 分 ， 我 们 会 深入 研究 如 何 比较 字符 串 ， 因 为 


不 正确 的 比较 会 产生 误导 或 无 效 结果 ， 理 解 字 符 串 的 比较 能 帮助 你 避 开 不 正确 的 操 
作 。 这 种 认识 能 让 你 触 类 旁 通 。 


比较 字符 串 的 标准 方法 是 用 strcmp 函数 ， 原 型 如 下 : 


int strcmp(const char *S1，Const char *s2); 












































要 比较 的 两 个 字符 串 都 以 指向 char 常量 的 指针 的 形式 传递 ， 这 让 我 们 可 以 放心 地 

使 用 这 个 国 数 ， 而 不 用 担心 传 入 的 字符 串 被 修改 。 这 个 国 数 返回 以 下 三 种 值 之 一 。 

。 负数 
如 果 按 字典 序 (字母 序 ) s1 比 s2 小 就 返回 负数 。 





v0 
如 果 两 个 字符 串 相等 就 返回 0。 
。 正 数 


如 果 按 字典 序 s1 比 s2 大 就 返回 正 数 。 


正 数 和 负数 返回 值 对 于 按 字母 序 对 字符 串 进 行 排序 很 有 用 ， 使 用 这 个 函数 判断 相等 
性 的 用 法 如 下 所 示 。 用 户 的 输入 存储 在 command 中 ， 然 后 跟 字符 串 字 面 量 比较 ; 





char command[16]; 


printf("Enter a Command: "); 
scanf("%s", command); 
if (strcmp(command, "Quit") == 0) { 
printf("The command was Quit"); 
} else { 
printf("The command was not Quit"); 
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本 例 的 内 存 分 配 见 图 5-6。 











600|olu it 字符 串 字 面 量 池 





main || command 300 [Qfu Li Tt ho ]. 口 ] 
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5-6: strcmp 示例 


比较 两 个 字符 串 有 几 种 不 正确 的 写法 ， 第 一 种 试图 用 赋值 操作 符 作 比 较 ， 如 下 : 





char command[16]; 


printf("Enter a Command: "); 
scanf("%s",command); 
if(command = "Quit") { 


首先 ， 这 不 是 作 比 较 ， 其 次 ， 这 样 会 导致 类 型 不 兼容 的 语法 错误 ， 我 们 不 能 把 字符 
串 字 面 量 地 址 赋 给 数组 名 字 。 在 本 例 中 ， 我 们 试图 把 字符 串 字面 量 的 地 址 (也 就 是 
600) 赋 给 command。command 是 数组 ， 不 用 数组 下 标 就 把 一 个 值 赋 给 这 个 变量 是 
不 可 能 的 。 


另 一 种 方法 是 用 相等 操作 符 : 











char command[16]; 
printf("Enter a Command: "); 


scanf("%s",command); 
if(command == "Quit") { 


这 样 会 得 到 假 ， 因 为 我 们 比较 的 是 command 的 地 址 (300) 和 字符 串 字 面 量 的 地 址 
(600)。 相 等 操作 符 比较 的 是 地 址 ， 而 不 是 地 址 中 的 内 容 ， 用 数组 名 字 或 者 字符 上 串 
字面 量 就 会 返回 地 址 。 

5.2.2 复制 字符 串 

复制 字符 串 是 常见 的 操作 ， 通 常用 strcpy 函数 实现 ， 其 原型 如 下 : 


char* strcpy(char *sl, const char *s2); 
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本 市 会 讲 到 基本 的 复制 过 程 和 常见 的 陷阱 。 假 设 要 将 一 个 已 有 的 字符 串 复制 到 动态 
分 配 的 缓冲 区 中 (也 可 以 用 字符 数组 )。 
有 一 类 常见 的 应 用 程序 会 读 入 一 系列 字符 串 ， 挨 个 存 入 占据 最 少 内 存 的 数组 。 要 实 


现 这 一 点 ， 可 以 创建 一 个 长 度 足以 容纳 用 户 可 能 输入 的 最 长 字符 串 的 数组 ， 并 且 把 
字符 串 读 入 这 个 数组 。 有 了 读 入 的 字符 串 ， 我 们 就 能 分 配合 适 的 内 存 。 基 本 的 方法 








是 这 样 的 : 








(1) 用 一 个 很 长 的 char 数组 读 入 字符 串 ; 
(2) 用 malloc 分配 恰 好 容纳 字符 串 的 适量 内 存 ，; 


(3) 用 strcpy 把 字符 串 复 





判 到 动态 分 配 的 内 存 中 。 


下 面 的 代码 说 明了 这 种 技术 。names 数组 会 持 有 每 个 读 入 的 名 字 的 指针 ， 而 count 
变量 则 指定 下 一 个 可 用 的 数组 元 素 。name 数组 用 来 持 有 读 入 的 字符 串 ， 每 个 读 入 


的 名 字 都 可 以 重复 利用 它 





，mattLoc 函数 分 配 每 个 字符 串 所 需 的 内 存 并 将 其 赋 给 





names 中 下 一 个 可 用 的 元 素 。 之 后 将 名 字 复 制 到 新 分 配 的 内 存 中 : 


char name[32]; 
char *names[30]; 
size t count = 0; 


printf("Enter a name: 
Scanf("%s" ,name) ; 


六 


names[count] = (char*)malloc(strlen(name)+1); 
strcpy(names[count],name); 


Count++; 


我 们 可 以 在 一 个 循环 中 重复 这 个 操作 ， 每 次 迭代 增加 count 值 。 图 5-7 说 明了 对 于 
读 入 的 名 字 Sam， 这 些 处 理 的 内 存 布局 。 











mai 





n 


names[29] EE 
count[ 7] 








5-7: 复制 字符 串 
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两 个 指针 可 以 引用 同一 个 字符 串 。 两 个 指针 引用 同一 个 地 址 称 为 别名 ， 这 个 话题 会 
在 第 8 章 讲 到 。 尽 管 通常 情况 下 这 不 是 问题 ， 但 要 知道 ， 把 一 个 指针 赋值 给 男 一 个 
指针 不 会 复制 字符 串 ， 只 是 复制 了 字符 串 的 地 址 。 








为 了 说 明 这 一 点 ， 下 面 声 明了 页 眉 指 针 的 数组 。 我 们 将 字符 串 字 面 量 的 地 
址 赋 给 了 索引 为 12 的 页 面 ， 接 着 ， 把 pageHeaders[12] 中 的 指针 复制 到 
pageHeaders[13]。 现 在 这 两 个 指针 都 指向 同一 个 字符 串 字 面 量 。 这 里 复制 的 是 指 
针 而 不 是 字符 串 : 








char *pageHeaders[300]; 


pageHeaders[12] = "Amorphous Compounds " ; 
pageHeaders[13] = pageHeaders[12]; 





图 5-8 解释 了 这 些 赋值 操作 。 








Amorphous Compounds 


pageHeaders[0 
pageHeaders[1 
pageHeaders[2] 
pageHeaders[3 

main 
pageHeaders[12 
pageHeaders[13] 





pageHeaders[29] 
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5-8: 复制 指针 的 效果 


5.2.3 ”拼接 字符 串 

字符 串 拼 接 涉及 两 个 字符 串 的 合并 。strcat 函数 经 常用 来 执行 这 种 操作 ， 这 个 函 
数 接受 两 个 字符 串 指针 作为 参数 ， 然 后 把 两 者 拼接 起 来 并 返回 拼接 结果 的 指针 。 这 
个 国 数 的 原型 如 下 : 








char *strcat(char *Ss1，CcConst char *s2); 


此 函数 把 第 二 个 字符 串 拼 接 到 第 一 个 的 结尾 ， 第 二 个 字符 串 是 以 常量 char 指针 的 
形式 传递 的 。 函 数 不 会 分 配 内 存 ， 这 意味 着 第 一 个 字符 串 必 须 足 够 长 ， 能 容纳 拼接 
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后 的 结果 ， 否 则 函数 可 能 会 越界 写 入 ， 导 致 不 可 预期 的 行为 。 函 数 的 返回 值 的 地 址 





跟 第 一 个 参数 的 地 址 一 样 。 这 在 某 些 情况 下 比较 方便 ， 比 如 这 个 函数 作为 printf 
函数 的 参数 时 。 





为 了 说 明 这 个 函数 的 用 法 ,我们 会 组 合 两 个 错误 消息 字符 串 。 第 一 个 是 前 级 ， 第 二 
个 是 具体 的 错误 消息 。 如 下 所 示 ， 我 们 首先 在 缓冲 区 中 为 两 个 字符 串 分 配 足够 的 内 
存 ， 然 后 把 第 一 个 字符 串 复制 到 缓冲 区 ， 最 后 将 第 二 个 字符 串 和 缓冲 区 拼接 : 





























char* error = "ERROR: " 
char* errorMessage = "Not enough memory"; 


char* buffer = (char*)malloc(strlen(error)+strlen(errorMessage)+1); 
strcpy(buffer,error); 
strcat(buffer, errorMessage); 


printf("%s\n", buffer); 
printf("%s\n", error); 
printf("%s\n", errorMessage); 


我 们 matioe 四 数 且 会 烧 加 了 古 罗 二 窑 作 NUL 党 税 。 假设 第 一 个 字面 量 在 内 存 中 
的 位 置 就 在 第 二 个 字面 量 前 面 ， 这 上段 代码 的 输出 会 像 下 面 这 样 。 图 5-9 说 明了 内 存 
分 配 情 况 








ERROR: Not enough memory 
ERROR: 
Not enough memory 
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图 5-9: 正确 的 拼接 操作 


妇 


0 








A en de 写 第 二 个 字符 串 ， 下 


面 这 个 没有 用 到 缓冲 区 的 例子 会 说 明 这 一 点 。 我 们 仍然 假设 第 一 个 字面 量 在 内 存 中 
的 位 置 就 在 第 二 个 字面 量 前 面 : 

















char* error = "ERROR: " 
char* errorMessage = "Not enough memory"; 


strcat(error, errorMessage); 
printf("%s\n", error); 
printf("%s\n", errorMessage); 





这 段 代 码 的 输出 如 下 : 


ERROR: Not enough memory 
ot enough memory 





errorMessage 字符 串 会 左 移 一 个 字符 ， 原 因 是 拼接 后 的 结果 履 写 了 errorMessage。 
字面 量 "Not enough memory" 紧 跟 在 第 一 个 字面 量 之 后 ， 因 此 履 写 了 第 二 个 字面 
量 。 图 5-10 解释 了 这 一 点 ， 字 面 量 池 的 状态 显示 在 左边 ， 右 边 是 复制 操作 后 的 状态 。 




















4 串 字面 量 池 
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复制 操作 后 508 














图 5-10: 不 正确 的 字符 串 拼接 操作 
如 果 我 们 像 下 面 这 样 用 char 数组 而 不 是 用 指针 来 存储 字符 串 ， 就 不 一 定 能 工作 了 : 





char error[] = "ERROR: " 
char errorMessage[] = "Not enough memory"; 


如 果 用 下 面 这 个 strcpy 调用 会 得 到 一 个 语法 错误 ， 这 是 因为 我 们 试图 把 函数 返回 
的 指针 赋 给 数组 名 字 ， 这 类 操作 不 合法 : 














error = strcat(error, errorMessage); 


如 果 像 下 面 这 样 去 掉 赋值 ， 束 可 能 会 有 内 存 访 问 的 漏洞 ， 因 为 复制 操作 会 履 写 栈 帧 
的 一 部 分 。 这 里 假设 在 函数 内 部 声明 数组 ， 如 图 5-11 所 示 。 无 论 源 字符 串 是 存储 在 
字符 串 字 面 量 池 中 还 是 栈 帧 中 ， 都 不 应 该 用 来 直接 存放 拼接 后 的 结果 ， 一 定 要 专门 
为 拼接 结果 分 配 内 在 : 












































strcat(error, errorMessage); 
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图 5-11: 履 写 栈 帧 


拼接 字符 串 时 容易 犯错 的 另 一 个 地 方 是 使 用 字符 字面 量 而 不 是 字符 串 字 面 量 。 在 下 
例 中 ， 我 们 将 一 个 字符 串 拼 接 到 一 个 路 径 字符 串 后 ， 这 样 是 能 如 期 工作 的 : 








char* path = "C:"; 
char* currentPath = (char*) malloc(strlen(path)+2); 
currentPath = strcat(currentPath,"\\"); 


因为 额外 的 字符 和 NUL 字符 需要 空间 ， 我 们 在 maLtLoc 调用 中 给 字符 串 长 度 加 了 2。 
因为 在 字符 串 字 面 量 中 用 了 转 义 序列 ， 所 以 这 里 拼接 的 是 一 个 反 斜 杠 字符 。 

不 过 ， 如 果 使 用 字符 字面 量 ， 如 下 所 示 ， 那 么 就 会 得 到 一 个 运行 时 错误 ， 原 因 是 第 
二 个 参数 被 错误 地 解释 为 char 类 型 变量 的 地 址 !; 











currentPath = strcat(path,'\\'); 


5.3 ”传递 字符 串 

传递 字符 串 很 简单 ， 在 函数 调用 中 ， 用 一 个 计算 结果 是 char 类 型 变量 地 址 的 表达 
式 即 可 。 在 参数 列表 中 ， 把 参数 声明 为 char 指针 。 有 趣 的 事情 发 生 在 函数 内 部 使 
用 字符 串 时 。 我 们 首先 会 在 5.3.1 节 和 5.3.2 节 研 究 如 何 传递 简单 字符 串 ， 然 后 在 
5.3.3 节 中 研究 如 何 传递 需要 初始 化 的 字符 串 。 把 字符 串 作 为 参数 传递 给 应 用 程序 会 
在 5.3.4 节 中 讲解 。 


5.3.1 传递 简单 字符 串 
取决 于 不 同 的 字符 串 声 明 方式 ， 有 几 种 方法 可 以 把 字符 串 的 地 址 传递 给 函数 。 在 本 
节 中 ， 我 们 会 利用 一 个 模拟 strlen 的 函数 说 明 这 些 技术 ,该 函数 的 实现 如 下 代码 
































注 1: 此 处 其 实 是 个 整数 ， 而 参数 是 char* ， 所 以 整数 被 当成 了 地 址 。 一 一 译 者 广 
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所 示 。 我 们 用 括号 来 强制 后 面 的 自 增 操作 符 先 执行 ， 使 得 指针 加 1。 否 则 加 1 的 就 
是 string 引用 的 字符 了 ， 这 不 是 我 们 想 要 的 结果 。 














size t stringLength(char* string) { 
size t length = 0; 
while(*(string++)) { 
length++; 
} 


return Length ; 


字符 串 实 际 上 应 该 以 char 常量 的 指针 的 形式 传递 ，5.3.2 节 会 讨论 这 一 点 。 








让 我 们 从 下 面 的 声明 开始 : 


char simpleArray[] = "simple string"; 
char *simplePtr = (char*)malloc(strlen("simple string")+1); 
strcpy(simplePtr, "simple string"); 


要 对 这 个 指针 调用 此 函数 ， 只 要 用 指针 名 字 即 可 : 
printf("%d\n",stringLength(simplePtr)); 

要 使 用 数组 调用 函数 ,我们 有 三 种 选择 ， 如 下 所 示 。 在 第 一 个 语句 中 ， 我 们 用 了 数 

组 的 名 字 ， 这 会 返回 其 地 址 。 在 第 二 个 语句 中 ， 显 式 使 用 了 取 地 址 操作 符 ， 不 过 这 

样 写 有 元 余 ， 没 有 必要 ， 而 且 会 产生 警告 。 在 第 三 个 语句 中 ， 我 们 对 数组 第 一 个 元 

素 用 了 取 地 址 操作 符 ， 这 样 可 以 工作 ， 不 过 有 点 繁琐 ， 











printf("%d\n",stringLength(simpleArray)); 
printf("%d\n",stringLength(&simpleArray)); 
printf("%d\n",stringLength(&simpleArray[0])); 


5-12 说 明了 stringLength 函数 的 内 存 分 配 情 况 。 


tringLength 
ron || inv oo LTTETTE TTT 
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5-12: 传递 字符 串 
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现在 让 我 们 把 注意 力 转移 到 形 参 的 声明 方式 上 。 在 前 面 stringLength 的 实现 中 ， 
我 们 把 参数 声明 为 char 指针 ， 不 过 也 可 以 像 下 面 这 样 用 数组 表示 法 : 





size t stringLength(char string[]) { ... } 


函数 体 还 是 一 样 ， 这 个 变化 不 会 对 函数 的 调用 方式 及 其 行为 造成 影响 。 


5.3.2 ”传递 字符 常量 的 指针 

以 字符 常量 指针 的 形式 传递 字符 串 指 针 是 很 常见 也 很 有 用 的 技术 ， 这 样 可 以 
用 指针 传递 字符 串 ， 同 时 也 能 防止 传递 的 字符 串 被 修改 。 下 面 对 35.3.1 节 中 的 
stringLength 函数 更 好 的 实现 就 是 利用 了 这 种 声明 : 


size t stringLength(const char* string) { 
size t length = 0; 
while(*(string++)) { 
length++; 
} 
return Length ; 


} 


如 果 我 们 试图 像 下 面 这 样 修改 原 字符 串 ， 那 么 就 会 产生 一 个 编译 时 错误 消息 : 





size t stringLength(const char* string) { 
*string = 'A'; 


} 


5.3.3 ”传递 需要 初始 化 的 字符 串 

有 些 情况 下 我 们 想 让 函数 返回 一 个 由 该 函数 初始 化 的 字符 串 。 假 设 我 们 想 传递 一 个 
部 件 的 信息 ， 比 如 名 字 和 数量 ， 然 后 让 国 数 返回 表示 这 个 信息 的 格式 化 字符 串 。 通 
过 把 格式 化 处 理 放 在 函数 内 部 ， 我 们 可 以 在 程序 的 不 同 部 分 重用 这 个 函数 。 

不 过 ， 我 们 得 决定 是 给 函数 传递 一 个 空 缓冲 区 让 它 填充 并 返回 ， 还 是 让 函数 动态 分 
配 缓冲 区 并 返回 。 

要 传递 缓冲 区 : 

。 必须 传递 缓冲 区 的 地 址 和 长 度 ; 

。 调用 者 负责 释放 缓冲 区 ; 

。 国 数 通 常 返回 缓 诈 区 的 指针 。 


这 种 方法 把 分 配 和 释放 缓冲 区 的 责任 都 交 给 了 调用 者 。 虽 然 没 有 必要 ， 返 回 缓冲 区 
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指针 很 常见 ，strcpy 或 类 似 函 数 就 是 这 种 情况 。 下 面 的 format 函数 说 明了 这 种 方法 : 


char* format(char *buffer, size t size, 
const char* name, size t quantity, size t weight) { 
snprintf(buffer, size, "Item: %s Quantity: %u Weight: %u", 
name, quantity, weight); 
return buffer; 


} 


这 里 用 了 snprintf 函数 来 简化 字符 串 格式 化 ， ee 
区 。 第 二 个 参数 指定 缓冲 区 的 长 度 ， 函 数 不 会 越过 缓冲 区 写 入 。 其 他 方面 ， 
数 和 printf 函数 的 行为 一 样 。 








下 面 的 语句 说 明了 这 个 函数 的 用 法 。 它 假设 缓冲 区 已 被 声明 为 一 个 数组 。 如 果 已 动 
态 分 配 缓冲 区 的 内 存 ， 则 需要 传 和 分配 的 内 存 大 小 ， 而 不 是 使 用 函数 的 大 小 。 


printf("%s\n",format(buffer,sizeof (buffer),"Axle",25,45)); 
输出 如 下 : 


Item: Axle Quantity: 25 Weight: 45 








通过 返回 缓冲 区 的 指针 ， 我 们 可 以 将 函数 作为 printf 函数 的 参数 。 


还 有 一 种 方法 是 传递 NULL 作为 缓冲 区 地 址 ， 这 表示 调用 者 不 想 提供 缓冲 区 ， 或 者 
它 不 确定 缓冲 区 应 该 是 多 大 。 这 样 的 函数 实现 列 在 了 下 面 ， 在 计算 长 度 时 , 10 + 10 
子 表达 式 表 示 数 量 和 重量 可 能 的 最 大 宽度 ， 而 1 则 是 为 NUL 终结 符 留 下 空间 : 





char* format(char *buffer, size t size, 
const char* name, size t quantity, size t weight) { 


char *formatString = "Item: %s Quantity: %u Weight: %u"; 
size t formatStringLength = strlen(formatString)-6; 
size t nameLength = strlen(name); 
size t length = formatStringLength + nameLength + 

10 + 10+1; 


if(buffer == NULL) { 
buffer = (char*)malloc(length); 
size = length,; 


snprintf(buffer, size, formatString, name, quantity, weight); 
return buffer; 


} 


函数 使 用 的 变量 取决 于 应 用 程序 的 需要 。 第 二 种 方法 的 主要 缺点 在 于 调用 者 现在 要 
负责 释放 分 配 的 内 存 ， 调 用 者 需要 对 函数 的 使 用 方法 了 如 指 掌 ， 否 则 可 能 很 容易 产 
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5.3.4 给 应 用 程序 传递 参数 

main 函数 通常 是 应 用 程序 第 一 个 执行 的 函数 。 对 基于 命令 行 的 程序 来 说 ， 通 过 为 其 
传递 信息 来 打开 某 种 行为 的 开关 或 控制 某 种 行为 很 常见 。 可 以 用 这 些 参数 来 指定 要 
处 理 的 文件 或 是 配置 应 用 程序 的 输出 。 比 如 说 ，Linux 的 1s 命令 会 基于 接收 到 的 参 
数列 出 当前 目录 下 的 文件 。 


C 用 传统 的 argc 和 argv 参数 支持 命令 行 参 数 。 第 一 个 参数 argc， 是 一 个 指定 传递 
的 参数 数量 的 整数 。 系 统 至 少 会 传递 一 个 参数 ， 这 个 参数 是 可 执行 文件 的 名 字 。 第 二 
个 参数 argv， 通 常 被 看 做 字符 串 指针 的 一 维 数组 ， 每 个 指针 引用 一 个 命令 行 参数 。 


下 面 的 main 函数 只 是 简单 地 列 出 了 它 的 参数 ， 每 行 一 个 。 在 这 个 版 本 中 ，argv 被 
声明 为 一 个 char 指针 的 指针 。 
int main(int argc, char** argv) { 


for(int i=0; i<argc; i++) { 
printf("argv[%d] %s\n",i,argv[i]); 
























































} 

pe 
程序 可 以 用 下 面 的 命令 执行 : 

process.exe -f names.txt Limit=12 -verbose 
输出 如 下 : 

argv[0] c:/process.exe 

argv[1] -f 
argv[2] names.txt 

I 


argv[3] limit=12 
argv[4] -verbose 


使 用 空格 将 每 个 命令 行 参数 分 开 ， 这 个 程序 的 内 存 分 配 如 图 5-13 所 示 。 








argv[0] 300 
argv[1] 304 
argv[2] 308 
argv[3] 312 


argvl4] 316 | 600 | 


main | | 
argy 














图 5-13: 使 用 argc/argv 
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argv 的 声明 可 以 简化 如 下 : 


int main(int argc, char* argv[]) { 


这 跟 char** argv 是 等 价 的 ，1.4.1 节 详 细 解 释 了 这 种 表示 法 。 


5.4 返回 字符 上 串 


函数 返回 字符 串 时 ， 它 返回 的 实际 是 字符 串 的 地 址 。 这 里 应 该 关注 的 主要 问题 是 如 
何 返 回合 法 的 地 址 ， 要 做 到 这 一 点 ， 可 以 返回 以 下 三 种 对 象 之 一 的 引用 : 








2 字面 量 ， 
。 动态 分 配 的 内 存 ; 
本 地 字符 串 变 量 。 


5.4.1 返回 字面 量 的 地 址 
返回 字面 量 的 例子 如 下 所 示 ， 利 用 一 个 整数 码 从 四 个 处 理 中 心 选 择 一 个 。 这 个 函数 的 
目的 是 把 处 理 中 心 的 名 字 作 为 字符 串 返 回 。 在 本 例 中 ， 它 只 是 返回 了 字面 量 的 地 址 ; 











char* returnALiteraL(int code) { 
Switch(code) { 
case 100: 
return "Boston Processing Center"; 
case 200: 
return "Denver Processing Center"; 
case 300: 
return "Atlanta Processing Center"; 
case 400: 
return "San Jose Processing Center"; 


} 


这 段 代 码 会 工作 得 很 好 。 唯 一 需要 记 住 的 一 
做 常量 ，5.1.2 节 讨 论 过 这 一 点 。 也 可 以 像 下 例 总 这 样 声明 静态 字面 量 ， 我 们 增加 了 
subCode 字段 来 选择 不 同 的 中 心 ， 这 么 做 的 好 处 是 无 和 在 不 同 的 直方 信用 同一 个 字 
面 量 ， 也 就 不 会 因为 打 错字 而 引入 错误 了 : 














char* returnAStaticLiteral(int code, int subCode) { 
static char* bpCenter "Boston Processing Center"; 
static char* dpCenter "Denver Processing Center"; 
static char* apCenter "Atlanta Processing Center"; 
static char* sjpCenter = "San Jose Processing Center"; 


switch(code) { 
case 100: 
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return bpCenter 
case 135 : 
if(subCode <35) { 
return dpCenter; 
} elsef{ 
return bpCenter; 
} 
case 200: 
return dpCenter; 
case 300: 
return apCenter; 
case 400: 
return sjpCenter; 


} 
针对 多 个 不 同 目的 返回 同一 个 静态 字符 串 的 指针 可 能 会 有 问题 。 考 虑 下 面 的 函数 ， 


这 是 在 5.3.3 市 中 开发 的 format 函数 的 变 体 。 将 一 个 部 件 的 信息 传递 给 函数 ， 然 后 
返回 一 个 表示 这 个 部 件 的 格式 化 字符 串 : 








char* staticFormat(const char* name, size t quantity, size t weight) { 
static char buffer[64]; // 假设 缓冲 区 足够 大 
sprintf(buffer, "Item: %s Quantity: %u Weight: %u", 
name, quantity, weight); 
return buffer; 





} 
为 缓冲 区 分 配 64 字 市 可 能 够 ,也 可 能 不 够 ， 就 本 例 的 目的 而 言 ， 我 们 会 名 略 这 个 潜 
在 的 问题 。 这 种 方法 的 主要 问题 用 如 下 代码 片段 说 明 : 


char* part1 staticFormat ("Axle",25,45); 
char* part2 staticFormat("Piston",55,5); 
printf("%s\n",part1); 
printf("%s\n",part2); 


执行 后 得 到 如 下 输出 : 


Item: Piston Quantity: 55 Weight: 5 
Item: Piston Quantity: 55 Weight: 5 


staticFormat 两 次 调用 都 使 用 同一 个 静态 缓冲 区 ， 后 一 次 调用 会 履 写 前 一 次 调用 
的 结果 。 














5.4.2 返回 动态 分 配 内 存 的 地 址 

如 果 需 要 从 函数 返回 字符 串 ， 我 们 可 以 在 堆 上 分 配 字符 串 的 内 存 然后 返回 其 地 址 。 
我 们 会 开发 一 个 blanks 函数 来 说 明 这 种 技术 ， 这 个 函数 会 返回 一 个 包含 一 系列 代 
表 “ 制 表 符 ” 的 空白 的 字符 串 ， 如 下 所 示 。 函 数 接受 一 个 指定 制 表 符 序 列 长 度 的 整 
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char* blanks(int number) { 
char* spaces = (char*) malloc(number + 1); 


Tnit 于 3 

for (i = 0; i<number; i++) { 
spaces[i] = " 

} 

spaces[number] = ' 0 '; 


return spaces; 


char *tmp = blanks(5); 


将 NUL 终结 符 赋 给 由 number 索引 的 数组 的 最 后 一 个 元 素 ， 图 5-14 说 明了 本 例 的 内 
存 分 配 ， 它 显示 了 blanks 函数 返回 前 后 应 用 程序 的 状态 。 
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blanks yimber 
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函数 返回 前 的 程序 栈 














图 5-14: 返回 动态 分 配 的 字符 串 


释放 返回 的 内 存 是 函数 调用 者 的 责任 ， 如 果 不 再 需要 内 存 但 没有 将 其 释放 会 造成 内 
存 泄漏 。 下 面 是 一 个 内 存 泄漏 的 例子 ，printf 函数 中 使 用 了 字符 串 ， 但 是 接着 它 
的 地 址 就 丢失 了 ， 因 为 我 们 没有 保存 : 


printf("[%s]\n",blanks(5)); 








一 个 更 安全 的 方法 如 下 所 示 : 
char *tmp = blanks (5); 


printf("[%s]\n",tmp); 
free(tmp); 


返回 局 部 字符 串 的 地 址 
返回 局 部 字符 串 的 地 址 可 能 会 有 问题 ， 如 果 内 存 被 别 的 栈 帧 覆 写 就 会 损坏 ， 应 该 避 
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免 使 用 这 种 方法 ， 这 里 作 解 释 只 是 为 了 说 明 实际 使 用 这 种 方法 的 鹤 在 问题 


我 们 重 写 前 面 的 bLanks 国 数 ， 如 下 所 示 。 在 函数 内 部 声明 一 个 数组 ， 而 不 是 动态 
分 配 内 存 ， 这 个 数组 位 于 栈 帧 上 。 函 数 返回 数组 的 地 址 : 





#define MAX_TAB_LENGTH 32 


char* blanks(int number) { 
char spaces[MAX TAB LENGTH]; 


nt 

for (i = 0; i < number && i < MAX TAB LENGTH; i++) { 
spaces[i] = 

} 

spaces[i] = '\0'，; 


return spaces; 


} 


执行 函数 后 会 返回 数组 的 地 址 ， 但 是 之 后 下 一 次 函数 调用 会 履 写 这 块 内 存 区 域 。 解 
a 图 5-15 说 明了 程序 栈 的 状态 。 




















Program Stack 





5-15: 返回 局 部 字符 串 的 地 址 


5.5 ”函数 指针 和 字符 串 


我 们 已 经 在 3.3 节 中 深入 讨论 过 函数 指针 了 ， 它 们 是 控制 程序 执行 的 一 种 非常 灵活 
的 方法 。 在 本 节 中 ， 我 们 会 通过 将 比较 国 数 传递 给 排序 函数 来 说 明 这 种 能 力 。 排 序 
国 数 通过 比较 数组 的 元 素来 判断 是 否 交换 数组 元 素 ， 比 较 决 定 了 数组 是 按 升序 还 是 
降序 (或 者 其 他 排序 策略 ) 排列 。 通 过 传递 一 个 函数 来 控制 比较 ， 排 序 函 数 会 变 得 
ea 传递 不 同 的 比较 函数 可 以 让 同一 个 排序 函数 以 不 同 的 方式 工作 。 


我 们 使 用 的 比较 函数 根据 数组 的 元 素 大 小 写 决 定 排序 顺序 。 下 面 的 compare 和 
compareIgnoreCase 会 根据 大 小 写 比 较 字 符 串 。 在 用 strcmp 函数 比较 字符 串 之 
前 ，compareIgnoreCase 函数 会 先 把 字符 串 转 换 成 小 写 。 Se 经 讨论 过 

strcmp 函数 了 。stringToLower 函数 返回 动态 分 配 内 存 的 指针 ， 这 意味 着 一 旦 不 
































需要 就 应 该 将 其 释放 掉 。 


int compare(const char* sl, const char* S2) { 
return strcmp(s1,s2); 


} 


int compareIgnoreCase(const char* sl, const char* S2) { 
char* tl = stringToLower(s1); 
char* t2 = stringToLower(s2); 
int result = strcmp(t1, t2); 
free(t1); 
free(t2); 
return result; 


} 


stringToLower 函数 如 下 所 示 ， 它 将 传递 进来 的 字符 串 用 小 写 的 形式 返 





char* stringToLower(const char* string) { 
char *tmp = (char*) malloc(strlen(string) + 1); 
char *start = tmp; 
while (*string != 0) { 
*tmp++ = tolower(*string++); 
} 
*tmp = 0; 
return start; 


} 
使 用 如 下 的 类 型 定义 声明 我 们 要 使 用 的 函数 指针 : 


typedef int (fptrOperation)(const char*, const char*); 





回 


下 面 的 sort 函数 的 实现 基于 冒 泡 排 序 算法 ,我们 将 数组 地 址 、 数 组 长 度 以 及 一 个 
控制 排序 的 函数 指针 传递 给 它 。 在 if 语句 中 ， 调 用 传递 进来 的 函数 并 传递 数组 的 





两 个 元 素 ， 它 会 判断 这 两 个 元 素 是 否 需要 交换 。 


void sort(char *array[], int size, fptrOperation operation) { 
int swap = 1; 
while(swap) { 
swap = 0; 
for(int i=0; i<size-1; i++) { 
if(operation(array[il],array[i+1]) > 0){ 
swap = 1; 
char *tmp = array[il]; 
array[i] = array[i+1]; 
array[i+1] = tmp; 


} 


打印 函数 会 显示 数组 的 内 容 : 
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void displayNames(char* names[], int size) { 
for(int i=0; i<size; i++) { 
printf("%s ",names[i]); 
} 
printf("\n"); 
于 


我 们 可 以 用 两 个 比较 函数 中 的 任意 一 个 作为 参数 调用 sort 国 数 。 下 面 用 compare 
国 数 进行 区 分 大 小 写 的 排序 ; 








char* names[] = {"Bob", "Ted", "Carol", "Alice", "alice"}; 
sort(names,5,compare); 
displayNames (names,5); 


输出 如 下 : 


Alice Bob Carol Ted alice 


如 果 使 用 compareIgnoreCase 函数 ， 输 出 则 是 这 样 : 





Alice alice Bob Carol Ted 





这 样 sort 函数 就 灵活 得 多 了 ， 我 们 可 以 设计 并 传递 自己 想 要 的 任意 简单 或 复杂 的 
操作 来 控制 排序 ， 而 不 需要 针对 不 同 的 排序 需求 写 不 同 的 排序 函数 。 


5.6 小 结 


本 章 重点 讲解 了 字符 串 操作 和 指针 的 使 用 ， 字 符 串 的 结构 和 在 内 存 中 的 位 置 会 影响 
其 使 用 。 指 针 提 供 了 操作 字符 串 的 灵活 工具 ， 但 是 也 可 能 造成 误 用 字符 串 。 


我 们 也 提 到 了 字符 串 字面 量 和 字面 量 池 的 用 法 ， 理 解 字 面 量 有 助 于 我 们 理解 某 些 字 
符 串 赋值 操作 没有 按照 预期 工作 的 原因 ， 这 跟 字 符 串 的 初始 化 密切 相关 ， 这 一 点 我 
们 也 进行 了 深入 讨论 。 我 们 还 研究 了 一 些 标准 的 字符 串 操作 ， 指 出 了 哪些 地 方 容易 
出 问题 。 

给 函数 传递 字符 串 和 从 函数 返回 字符 串 是 常见 的 操作 ， 我 们 也 详细 讨论 了 关于 这 类 
操作 的 潜在 问题 ， 包 括 返回 局 部 字符 串 时 容易 出 现 的 问题 。 此 外 ， 我 们 还 讨论 了 字 
符 常量 指针 的 用 法 。 

最 后 ， 我 们 用 函数 指针 说 明了 实现 排序 函数 的 强大 方法 ， 这 种 方法 不 局 限于 排序 函 
数 ， 也 可 以 应 用 到 其 他 领域 。 
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第 6 章 


指针 和 结构 体 





我 们 可 以 使 用 C 的 结构 体 来 表示 数据 结构 元 素 ， 比 如 链表 或 树 的 节点 ， 指 针 是 把 这 
些 元 素 联系 到 一 起 的 纽带 。 理 解 指针 对 常见 数据 结构 多 种 功能 的 支持 可 以 为 创建 数 
据 结构 提供 便利 。 在 本 章 中 ， 我 们 会 探索 C 中 结构 体内 存 分 配 的 基础 和 几 种 常见 数 
据 结构 的 实现 。 


结构 体 加 强 了 数组 等 集合 的 实用 性 。 要 创建 实体 的 数组 〈 比 如 有 多 个 字段 的 颜色 类 
型 )， 如 果 不 用 结构 体 的 话 ， 就 得 为 每 个 字段 声明 一 个 数组 ， 然 后 把 每 个 字段 的 值 放 
在 每 个 数组 的 同一 个 索引 下 。 不 过 ， 有 了 结构 体 ， 我 们 可 以 只 声明 一 个 数组 ， 其 中 
的 每 个 元 素 是 一 个 结构 体 的 实例 。 


本 章 继续 拓展 前 面 所 学 的 指针 概念 ， 包 括 结构 体 的 数组 表示 法 、 结 构 体 的 内 存 分 配 、 
结构 体内 存 管 理 技术 以 及 函数 指针 的 用 法 。 

我 们 会 从 结构 体 的 内 存 分 配 开始 ， 理 解 内 存 分配 可 以 解释 很 多 操作 的 工作 原理 。 接 
着 我 们 会 介绍 减少 堆 管 理 开 销 的 技术 。 


最 后 一 方 说 明 如 何 用 指针 创建 一 系列 数据 结构 。 首 先是 链表 ， 链 表 是 其 他 儿 种 数据 
结构 的 基础 ， 最 后 是 树 数 据 结构 ， 它 没有 用 到 链表 。 











6.1 介绍 


声明 C 结构 体 的 方式 有 多 种 。 本 市 只 看 其 中 两 种 ， 因 为 我 们 主要 关注 的 是 结构 体 和 
指针 的 配合 使 用 。 在 第 一 种 方法 中 ， 我 们 用 struct 关键 字 声 明 一 个 结构 体 。 在 第 
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二 种 方法 中 ， 我 们 使 用 类 型 定义 。 在 下 面 的 声明 中 ， 结 构 体 的 名 字 前 面 加 了 下 划 线 ， 
这 不 是 必需 的 ， 不 过 通常 作为 命名 约定 。_person 结构 体 包 括 了 名 字 、 职 位 和 年 龄 


三 个 字段 。 








struct person { 
char* firstName; 
char* lastName; 
char* title; 
unsigned int age; 


j 


结构 体 的 声明 经 常 使 用 typedef 关键 字 简 化 之 后 的 使 用 。 下 面 说明 如 何 对 _person 
结构 体 用 typedef 关键 字 : 
typedef struct person { 
char* firstName; 
char* lastName; 
char* title; 


unsigned int age; 
} Person; 


person 的 实例 声明 如 下 : 
Person person,; 
我 们 也 可 以 声明 一 个 Person 指针 并 为 它 分 配 内 存 ， 如 下 所 示 : 


Person *ptrPerson; 
ptrPerson = (Person*) malloc(sizeof (Person)); 


如 果 使 用 结构 体 的 简单 声明 ( 像 person 那样 )， 那 么 就 用 点 表示 法 来 访问 其 字段 。 
在 下 例 中 ， 我 们 给 firstName 和 age 字段 赋 了 值 : 








Person person,; 

person.firstName = (char*)malloc(strlen("Emily")+1); 
strcpy(person.firstName, "Emily"); 

person.age = 23; 


不 过 ， 如 果 使 用 结构 体 指针 ， 就 需要 用 箭头 操作 符 ， 如 下 所 示 。 这 个 操作 符 由 一 个 
横 线 和 一 个 大 于 号 组 成 


Person *ptrPerson; 

ptrPerson = (Person*)malloc(sizeof (Person)); 
ptrPerson->firstName = (char*)malloc(strlen("Emily")+1); 
strcpy(ptrPerson->firstName, "Emily"); 

ptrPerson->age = 23; 


我 们 不 一 定 非得 用 箭头 操作 符 ， 可 以 先 解 引 指针 然后 用 点 操作 符 ， 如 下 所 示 ， 我 们 





又 执行 了 一 遍 赋 值 操作 : 


Person *ptrPerson; 

ptrPerson = (Personk)maLLoc(Ssizeof(Person) ) ; 

(*ptrPerson) .firstName = (char*)malloc(strlen("Emily")+1); 
strcpy((*ptrPerson).firstName, "Emily"); 

(*ptrPperson).age = 23; 


这 种 方法 有 些 笨拙 ， 不 过 你 偶尔 还 能 看 到 有 人 使 用 它 。 


为 结构 体 分 配 内 存 

为 结构 体 分 配 内 存 时 ， 分 配 的 内 存 大 小 至 少 是 各 个 字段 的 长 度 和 。 不 过 ， 实 际 长 度 
通常 会 大 于 这 个 和 ， 因 为 结构 体 的 各 字段 之 间 可 能 会 有 填充 。 某 些 数据 类 型 需要 对 
齐 到 特定 边界 就 会 产生 填充 。 比 如 说 ， 短 整数 通常 对 齐 到 能 被 2 整除 的 地 址 上 ， 而 
整数 对 齐 到 能 被 4 整除 的 地 址 上 。 


这 些 额 外 内 存 的 分 配 意 味 着 儿 个 问题 : 


。 要 谨慎 使 用 指针 算术 运算 ， 

。 结构 体 数组 的 元 素 之 间 可 能 存在 额外 的 内 存 。 

比如 说 ， 如 果 为 上 一 节 中 出 现 的 Person 结构 体 的 实例 分 配 内 存 ， 会 分 配 16 字 
节 一 一 每 个 元 素 4 字 节 。 下 面 这 个 版 本 的 Person 用 短 整 数 来 代替 无 符号 整数 作为 
age 的 类 型 。 这 样 分 配 的 内 存 大 小 还 是 一 样 ， 因 为 结构 体 末 尾 填充 了 2 字 市 : 












































typedef struct alternatePerson { 
char* firstName; 
char* lastName; 
char* title; 
short age; 
} AlternatePerson; 


在 下 面 的 代码 片段 中 ， 我 们 声明 了 Person 和 AlternatePerson 结构 体 的 实例 ， 
然后 打印 结构 体 的 长 度 。 它 们 的 长 度 相 同 ， 都 是 16 字 节 


Person person; 
AlternatePerson otherPerson; 


TEN 16 
TEN 16 


printf("%d\n",sizeof (Person)); 


// 失 
printf("%d\n",sizeof(AlternatePerson)); // 扣 























如 果 我 们 创建 一 个 ALternatePerson 的 数组 (如 下 所 示 ) ， 那 么 每 个 数组 元 素 之 间 
会 有 填充 ， 如 图 6-1 所 示 。 阴 影 区 域 表 示 数 组 元 素 之 间 的 空隙 。 





ALternatePerson people[30]; 
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people[0] 100 


people[1] 116 


people[2] 132 











6-1: ALternatePerson 的 数组 
如 果 我 们 把 age 字段 移 到 结构 体 的 两 个 字段 中 间 ， 那 么 空隙 就 处 于 结构 体内 部 。 根 
据 访问 结构 体 的 方式 ， 这 可 能 会 很 重要 。 


6.2 ”结构 体 释 放 问 题 


在 为 结构 体 分 配 内 存 时 ， 运 行 时 系统 不 会 自动 为 结构 体内 部 的 指针 分 配 内 存 。 类 似 
地 ， 当 结构 体 消失 时 ， 运 行 时 系统 也 不 会 自动 释放 结构 体内 部 的 指针 指向 的 内 存 。 


考虑 如 下 结构 体 : 























typedef struct person { 
char* firstName; 
char* lastName; 
char* title; 
uint age; 

} Person; 


当 我 们 声明 这 个 类 型 的 变量 或 者 为 这 个 类 型 动态 分 配 内 存 时 ， 三 个 指针 会 包含 垃圾 
数据 。 在 下 面 的 代码 片段 中 ， 我 们 声明 了 Person， 其 内 存 分 配 如 图 6-2 所 示 ， 三 个 
点 表示 未 初始 化 的 内 存 。 





void processPerson() { 
Person person; 





i 
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6-2: 未 初始 化 的 Person 结构 体 








在 这 个 结构 体 的 初始 化 阶段 ， 会 为 每 个 字段 赋 一 个 值 。 对 于 指针 字段 ， 我 们 会 从 堆 
上 分 配 内 存 并 把 地 址 赋 给 每 个 指针 : 


void initializePerson(Person *person, const char* fn, 

const char* ln, const char* title, uint age) { 

person->firstName = (char*) malloc(strlen(fn) + 1); 

strcpy(person->firstName, fn); 

person->LastName = (char*) malloc(strlen(ln) + 1); 

strcpy(person->lastName, 1n); 

person->title = (char*) malloc(strlen(title) + 1); 

strcpy(person->title, title); 

person->age = age; 


} 
可 以 如 下 这 样 使 用 这 个 函数 ， 图 6-3 说 明了 内 存 分 配 情况 : 


void processPerson() { 
Person person; 
initializePerson(&person, "Peter", "Underwood", "Manager", 36); 


} 
int main() { 
processPerson(); 
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6-3: 初始 化 的 Person 结构 体 


因为 这 个 声明 是 国 数 的 一 部 分 ， 国 数 返 回 后 person 的 内 存 会 消失 。 不 过 ， 动 态 分 








配 的 内 存 不 会 被 释放 ， 仍 然 保 存在 堆 上 。 不 幸 的 是 ， 我 们 丢失 了 它们 的 地 址 ， 








无 法 将 其 释放 ， 从 而 导致 了 内 存 泄 漏 。 


用 完 这 个 实例 后 需要 释放 内 存 。 下 面 的 函数 会 释放 之 前 创建 实例 时 分 配 的 内 存 : 


void deallocatePerson(Person *person) { 
free(person->firstName); 
free(person->LastName ) ; 
free(person->title); 


我 们 需要 在 函数 结束 前 调用 这 个 函数 : 





void processPerson() { 
Person person; 
initializePerson(&person, "Peter", "Underwood", "Manager", 36); 


deallocatePerson(&person); 


} 





因此 


另外 ， 我 们 必需 记得 调用 initialize 和 deallocate 函数 ， 但 诸如 C++ 这 类 面向 


对 象 的 编程 语言 会 自动 为 对 象 调用 这 些 操作 。 
如 果 用 Person 指针 ， 必 须 释 放 如 下 所 示 的 person: 


void processPerson() { 
Person *ptrPerson; 
ptrPerson = (Person*) malloc(sizeof(Person)); 





initializePerson(ptrPerson, "Peter", "Underwood", "Manager", 36); 
deallocatePerson(ptrPerson); 
free(ptrPerson); 


} 
图 6-4 说 明了 内 存 分 配 情况 。 
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6-4: 指向 person 实例 的 指针 


6.3 ”避免 malloc/free 开 销 


重复 分 配 然后 释放 结构 体会 产生 一 些 开 销 ， 可 能 导致 巨大 的 性 能 上 瓶颈。 解决 这 个 问 
题 的 一 种 办 法 是 为 分 配 的 结构 体 单独 维护 一 个 表 。 当 用 户 不 再 需要 某 个 结构 体 实 例 
时 ， 将 其 返回 结构 体 池 中 。 当 我 们 需要 某 个 实例 时 ， 从 结构 体 池 中 获取 一 个 对 象 。 
如 果 池 中 没有 可 用 的 元 素 ， 我 们 就 动态 分 配 一 个 实例 。 这 种 方法 高 效 地 维护 一 个 结 
构 体 池 ， 能 按 需 使 用 和 重复 使 用 内 存 。 

为 了 说 明 这 种 方法 ， 我 们 会 用 之 前 定义 的 Person 结构 体 。 用 数组 维护 结构 体 池 ， 
也 可 以 用 链表 等 更 复杂 的 表 ，6.4.1 节 有 相关 说 明 。 为 了 让 示例 简单 ， 我 们 用 了 指针 
数组 ， 声 明 如 下 : 








#define LIST SIZE 10 
Person *List[LIST SIZE]; 


使 用 表 之 前 需要 先 初始 化 。 下 面 的 函数 为 数组 每 个 元 素 峰值 NULL: 


void initiaLizeList() { 
for(int i=0; i<LIST SIZE; i++) { 
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list[i] = NULL; 


} 





我 们 用 两 个 函数 来 添加 和 获取 结构 体 。 第 一 个 是 getPerson 图 数 ， 如 下 所 示 。 如 果 
存在 可 用 的 结构 体 ， 这 个 函数 从 表 中 获取 一 个 。 将 数组 的 元 素 跟 NULL 比较 ， 返 回 
第 一 个 非 空 的 元 素 ， 然 后 将 它 在 List 中 的 位 置 赋值 为 NULL。 如 果 没 有 可 用 的 结构 
体 ， 那 就 创建 并 返回 一 个 新 的 Person 实例 。 这 样 就 避免 了 每 次 需要 结构 体 时 都 动 
态 分 配 内 存 的 开销 ， 我 们 只 在 池 中 为 空 时 才 分 配 内 存 。 返 回 实例 的 初始 化 可 以 在 返 
回 之 前 就 做 好 ， 也 可 以 由 调用 者 来 做 ， 取 决 于 应 用 程序 的 需要 。 

















Person *getPerson() { 
for(int i=0; i<LIST SIZE; i++) { 
if(List[i] != NULL) { 
Person *ptr = list[i]; 
list[i] = NULL; 
return ptr; 
} 
} 
Person *person = (Person*)malloc(sizeof (Person)); 
return person; 


} 


右 生 一 ~ 


第 二 个 函数 是 returnPerson， 这 个 函数 要 么 将 结构 体 返 回 表 ， 要 么 把 结构 体 释 放 
掉 。 我 们 会 检查 数组 元 素 看 看 有 没有 NULL 值 ， 有 的 话 就 将 person 添加 到 那个 位 
置 ， 然 后 返回 指针 。 如 果 表 满 了 ， 就 用 deallocatePerson 函数 释放 person 内 的 
指针 ， 然 后 释放 person， 最 后 返回 NULL。 








Person *returnPerson(Person *person) { 
for(int i=0; i<LIST SIZE; i++) { 
if(list[i] == NULL) { 
List[il = person; 
return person; 
} 
} 
deallocatePerson(person); 
free(person); 
return NULL; 
} 


下 面 的 代码 说 明了 表 的 初始 化 ， 以 及 如 何 将 一 个 结构 体 添加 到 表 中 : 


initializeList(); 
Person *ptrPerson; 


ptrPerson = getPerson(); 
initializePerson(ptrPerson,"Ralph","Fitsgerald", "Mr.",35); 
displayPerson(*ptrPerson); 

returnPerson(ptrPerson); 





这 种 方法 有 个 问题 ， 就 是 表 的 长 度 。 如 果 表 太 短 ， 那 么 就 需要 更 频繁 地 分 配 并 释放 
内 存 。 如 果 表 太 长 而 没有 使 用 结构 体 ， 那 么 就 会 浪费 大 量 的 内 存 ， 也 不 能 用 在 其 他 
地 方 。 可 以 用 更 复杂 的 表 管 理 策 略 来 管理 表 的 长 度 。 


6.4 ”用 指针 支持 数据 结构 


指针 可 以 为 简单 或 复杂 的 数据 结构 提供 更 多 的 灵活 性 。 这 些 灵活 性 可 能 来 自动 态 内 
存 分 配 ， 也 可 能 来 自 切换 指针 引用 的 便利 性 。 内 存 无 需 像 数组 那样 是 连续 的 ， 只 要 
总 的 内 存 大 小 对 就 可 以 。 


在 本 节 中 ， 我 们 会 研究 几 种 可 以 用 指针 实现 的 常用 数据 结构 。 很 多 C 库 都 会 提供 这 
里 提 到 的 数据 结构 ， 而 且 会 提供 更 广泛 的 支持 。 不 过 ， 理 解 如 何 实现 这 些 数据 结构 
对 于 实现 非 标准 的 数据 结构 很 有 帮助 。 在 某 些 平台 上 可 能 无 法 使 用 这 些 库 ， 开 发 者 
需要 实现 自己 的 版 本 。 


我 们 会 研究 以 下 四 种 不 同 的 数据 结构 。 
。 链表 
单 链 表 
。 队列 
简单 的 先进 先 出 队列 
。 栈 
简单 的 栈 
。 树 
二 又 树 


我 们 会 结合 函数 指针 和 这 些 数据 结构 来 说 明 它们 处 理 通用 结构 时 的 强大 能 力 。 链 表 
是 非常 有 用 的 数据 结构 ， 我 们 会 把 它 作为 实现 队列 和 栈 的 基础 。 
我 们 会 利用 一 个 雇员 结构 体 说 明 这 些 数据 结构 。 比 如 说 ， 链 表 由 互相 连接 的 节点 组 


成 ， 每 个 节点 会 持 有 用 户 提供 的 数据 ， 雇 员 结 构 体 如 下 所 示 。unsigned char 数据 
类 型 用 来 表示 年 龄 ， 它 足够 装 下 人 类 的 年 龄 了 : 


























typedef struct _empLoyeet 
char name[32]; 
unsigned char age; 

} Employee; 
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全 个 各 宇 用 于 个 数组 表示 ， 对 于 这 个 字段 ，char 指针 可 能 是 更 灵活 的 数据 类 型 ， 不 
过 简单 起 见 ， 我 们 还 是 选择 了 char 数组 。 


我 们 会 开发 两 个 比较 函数 ， 第 一 个 比较 两 个 雇员 然后 返回 一 个 整数 ， 它 模仿 了 
strcmp 函数 ， 返 回 值 0 表示 两 个 雇员 结构 体 相 等 ，-1 表示 第 一 个 雇员 比 第 二 个 雇 
员 小 ，1 表示 第 一 个 雇员 比 第 二 个 雇员 大 。 第 二 个 函数 则 用 来 打印 雇员 ; 





int compareEmployee(Employee *el, Employee *e2) { 
return strcmp(el->name, e2->name); 


} 


void displayEmployee(Employee* employee) { 
printf("%s\t%d\n", employee->name, employee->age); 
= 
此 外 ， 我 们 还 会 用 到 两 个 函数 指针 ， 定 义 如 下 。DISPLAY 函数 指针 表示 一 个 接受 
void* 参数 并 返回 void 的 函数 ， 目 的 是 显示 数据 。 第 二 个 函数 指针 COMPARE 比较 
两 个 指针 引用 的 数据 ， 它 的 返回 值 是 0、-1 或 1， 我 们 在 介绍 compareEmpLoyee 
国 数 的 时 候 解 释 过 了 : 


typedef void(*DISPLAY) (void*); 
typedef int(*COMPARE) (void*, void*); 


6.4.1 单 链表 

链表 是 由 一 系列 互相 连接 的 节点 组 成 的 数据 结构 。 通 常会 有 一 个 节点 称 为 头 节点 ， 
其 他 节点 顺序 跟 在 头 节点 后 面 ， 最 后 一 人 节点 。 我 们 可 以 用 指针 轻松 实 
现 节点 之 间 的 连接 ， 动 态 按 需 分 配 每 个 节 


这 种 方法 比 市 点 的 数组 好 ， 使 用 数组 的 结果 就 是 创建 固定 数量 的 厄 点 ， 而 不 管 实际 
需要 儿 个 。 节 点 之 间 的 连接 是 用 数组 元 素 的 索引 实现 的 。 使 用 数组 不 如 使 用 动态 内 
存 分 配 和 指针 灵活 。 


比如 说 ， 如 果 我 们 想 要 改变 数组 元 素 的 顺序 ， 就 需要 复制 两 个 元 素 ， 而 结构 体 元 素 
可 能 很 大 。 此 外 ， 对 于 添加 或 删除 元 素 ， 不 论 是 为 新 元 素 腾 出 空间 或 是 删除 已 有 元 
素 ， 都 可 能 需要 移动 数组 的 一 大 部 分 


链表 有 好 儿 种 类 型 ,最 简单 的 是 单 链 表 ， 一 个 而 点 到 下 一 个 市 点 只 有 一 个 连接 ， 连 
接 从 头 节 点 开始 ， 到 尾 节 点 结束 。 循 环 链表 没有 尾 节 点 ， 链 表 的 最 后 一 个 节点 又 指 
向 头 节 点 。 双 链表 用 了 两 个 链表 ， 一 个 向 前 连接 ， 一 个 向 后 连接 ， 我 们 可 以 在 两 个 
方向 上 查找 市 点 ， 这 类 链表 更 灵活 ， 但 是 也 更 难 实现 。 图 6-5 从 理论 上 解释 了 这 些 
类 型 的 链表 。 
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6-5: 链表 类 型 


这 一 市 我 们 来 看 看 如 何 创 建 和 使 用 单 链表 ， 下 面 的 代码 显示 了 用 来 支持 链表 的 结构 
体 ，Node 结构 体 定 义 一 个 节点 ， 它 有 两 个 指针 ， 第 一 个 是 void 指针 ， 持 有 任意 类 
型 的 数据 ， 第 二 个 是 指向 下 一 个 节点 的 指针 。LinkedList 结构 体 表示 链表 ， 持 有 
指向 头 节 点 和 尾市 点 的 指针 ， 当 前 指针 用 来 辅助 志 历 链表 : 





typedef struct node { 
void *data; 
struct node *next; 
} Node; 


typedef struct linkedList { 
Node *head; 
Node *tail; 
Node *current; 

} LinkedList; 


我 们 会 开发 儿 个 使 用 这 些 结构 体 支持 链表 功能 的 函数 : 
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void initializeList(LinkedList*) 初始 化 链表 


void addHead (LinkedList*, void*) 给 链表 的 头 节点 添加 数据 
void addTail (LinkedList*, void*) 给 链表 的 尾 节 点 添加 数据 
void delete(LinkedList*, Node*) 从 链表 删除 节点 





Node *getNode(LinkedList*, COMPARE, void*) 返回 包含 指定 数据 的 节点 指针 
void dispLayLinkedList(LinkedList*x，DISPLAY) ”打印 链表 


使 用 链表 之 前 要 先 初始 化 ， 如 下 所 示 的 initializeList 函数 执行 这 个 任务 ， 将 
LinkedList 对 象 的 指针 传递 给 函数 ， 函 数 把 结构 体 里 的 指针 置 为 NULL: 


void initializeList(LinkedList *list) { 
list->head = NULL; 
list->tail = NULL; 
List->current = NULL; 


} 





addHead 和 addTail 函数 分 别 向 链表 的 头 和 尾 添 加 数据 。 在 这 个 链表 的 实现 中 ， 
add 和 delete 函数 负责 分 配 和 释放 链表 节点 用 到 的 内 存 ， 这 样 就 不 需要 链表 用 户 
负责 了 。 


在 如 下 所 示 的 addHead 函数 中 ， 先 给 节点 分 配 内 存 ， 然 后 把 传递 给 函数 的 数据 赋 给 
结构 体 的 data 字段 。 通 过 把 data 以 void 指针 的 形式 传递 ， 链 表 就 能 够 持 有 用 户 
想 用 的 任何 类 型 的 数据 了 。 


接 下 来 ， 我 们 检查 链表 是 否 为 空 ， 如 果 为 空 ， 就 把 尾 指针 指向 节点 ， 然 后 把 节点 的 
next 字段 赋值 为 NULL;， 如 果 不 为 空 ， 那 么 将 市 点 的 next 指针 指向 链表 头 。 无 论 
哪 种 情况 ， 链 表 头 都 指向 节点 : 














void addHead(LinkedList *list, void* data) { 
Node *node = (Node*) malloc(sizeof (Node)); 
node->data = data; 
if (list->head == NULL) { 
list->tail = node; 
node->next = NULL; 
} else{ 
node->next = list->head; 
} 
list->head = node; 


} 

下 面 的 代码 片段 展示 了 ijnitializeList 和 addHead 函数 的 用 法 。 将 三 个 雇员 结 
构 体 添 加 到 链表 中 ， 图 6-6 显示 了 执行 这 些 语句 后 的 内 存 分 配 情况 。 为 了 简化 图 ， 
我 们 去 掉 了 一 些 箭头 ， 此 外 ， 还 简化 了 EmpLoyee 结构 体 的 name 数组 。 





LinkedList linkedList; 


Employee *samuel = (Employee*) malloc(sizeof (Employee)); 
strcpy(samuel->name, "Samuel"); 








samuel->age = 32; 


Employee *sally = (Employee*) malloc(sizeof (Employee)); 
strcpy(sally->name, "Sally"); 
sally->age = 28; 


Employee *susan = (Employee*) malloc(sizeof (Employee)); 
strcpy(susan->name, "Susan"); 
susan->age = 45; 


initializeList(&linkedList); 
addHead(&linkedList, samuel); 


addHead(&linkedList, sally); 
addHead(&linkedList, susan); 





name | Sally name 
age age 


main 


linkedList 











6-6: addHead 示例 


接 下 来 是 addTail 函数 。 它 先 为 新 节点 分 配 内 存 ， 然 后 把 数据 赋 给 data 字段 。 因 
为 我 们 总 是 将 节点 添加 到 末尾 ， 所 以 该 节点 的 next NULL。 如 果 链 表 
为 空 ， 那 么 head 指针 就 是 NULL， 就 可 以 把 新 节点 赋 给 head， 如 果 不 为 空 ， 那 么 


就 将 尾 节 ， 点 的 next 指针 赋 为 新 节点 。 无 论 如 何 ， tail 指针 赋 为 该 
节点 : 
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void addTail(LinkedList *list, void* data) { 
Node *node = (Node*) malloc(sizeof (Node)); 
node->data = data; 
node->next = NULL; 
if (list->head == NULL) { 
list->head = node; 
} elsef{ 
list->tail->next = node; 
} 
list->tail = node; 


} 


下 面 的 代码 片段 说 明了 addTail 国 数 的 用 法 。 这 里 就 不 重复 列 出 创建 雇员 对 象 的 代 
码 了 ，addTail 函数 将 雇员 以 跟 上 例 相 反 的 顺序 添加 进去 ， 这 样 内 存 分 配 情况 就 跟 
6-6 一 样 。 





initiaLizeList(SLinkedList) ; 


addTail(&linkedList, susan); 
addTail(&linkedList, sally); 
addTail(&linkedList, samuel); 


delete 国 数 从 链表 删除 一 个 节点 。 为 了 简化 这 个 国 数 ， 将 删除 节点 的 指针 作为 要 
传递 的 参数 。 函 数 的 用 户 可 能 有 数据 的 指针 ， 但 是 没有 持 有 数据 的 市 点 的 指针 ， 为 
了 帮助 定位 市 点 ， 我 们 提供 了 一 个 辅助 函数 getNode 来 返回 节点 的 指针 。getNode 
函数 接受 三 个 参数 : 

。 指向 链表 的 指针 ， 

。 指向 比较 函数 的 指针 ，; 

。 指向 要 查找 的 数据 的 指针 。 





下 面 是 getNode 国 数 的 代码 ， 变 量 node 一 开始 指向 链表 头 ， 然 后 我 们 遍历 链表 直 
到 找到 匹配 的 节点 或 者 到 达 链 表 的 末尾 。 我 们 调用 compare 函数 来 判断 当前 市 点 是 
否 匹配 。 当 两 个 数据 相等 时 ， 它 会 返回 0。 








Node *getNode(LinkedList *List，COMPARE compare , void* data) { 
Node *node = list->head; 
while (node != NULL) { 
if (compare(node->data, data) == 0) { 
return node; 
} 
node = node->next; 
} 
return NULL; 
} 


compare 函数 说 明了 如 何在 运行 时 用 函数 指针 来 决定 用 哪个 函数 执行 比较 操作 ， 这 





样 会 给 链表 的 实现 增加 可 观 的 灵活 性 ， 因 为 我 们 不 需要 在 getNode 函数 中 硬 编码 比 
较 函 数 的 名 字 。 


下 面 是 delete 函数 ， 为 了 保持 函数 简单 ， 它 不 会 检查 链表 内 的 空 值 和 传 入 的 市 点 。 
第 一 个 if 语句 处 理 删除 头 节点 的 情况 。 是 唯一 的 节点 ， 那 么 
和 尾 节 点 置 为 空 值 ， 否 则 ， 将 头 节 点 赋值 为 原 头 节点 的 下 一 个 节点 。 


else 语句 用 tmp 指针 从 头 到 尾 遍 历 链 表 ， 不 论 是 将 tmp J NULL (表示 要 找 
je 点 不 在 链表 中 )， 还 是 tmp 的 下 一 个 市 点 就 是 我 们 要 找 的 布点 ，while 循环 都 
结束 。 这 是 单 链 表 ， 所 以 我 们 需要 知道 要 删除 的 目标 节点 0 点 是 哪个 ， 必 
ne 才能 把 前 一 个 节点 的 next 字段 赋值 为 目标 节点 一 个 节点 。 在 
delete 国 数 的 末尾 ， 将 节点 释放 。 用 户 负 责 在 调用 delete 区 全 点 指向 
的 数据 。 
void delete(LinkedList *list, Node *node) { 
if (node == list->head) { 
if (list->head->next == NULL) { 
list->head = list->tail = NULL; 


} elsef 
list->head = list->head->next; 








} 
} else { 
Node *tmp = list->head; 
while (tmp != NULL && tmp->next != node) { 
tmp = tmp->next; 


} 
if (tmp != NULL) { 
tmp->next = node->next; 
} 
} 


free(node); 


} 


下 面 的 代码 片段 说 明了 这 个 函数 的 使 用 方法 。 将 三 个 雇员 添加 到 链表 头 上 ， 我 们 用 
6.4 节 中 提 到 的 compareEmployee 函数 来 进行 比较 操作 : 
addHead(&linkedList, samuel); 


addHead(&linkedList, sally); 
addHead(&linkedList, susan); 


Node *node = getNode(&linkedList, 


(int (*)(void*, void*))compareEmployee, sally); 
delete(&linkedList, node); 


执行 这 段 代 码 后 程序 栈 和 推 的 状态 如 图 6-7 所 示 。 
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name | Sally name 
age age 


main 











6-7: 删除 示例 


如 下 所 示 的 dispLayLinkedList 函数 说 明 如 何 壳 历 链 表 ， 从 头 节点 开始 ， 用 第 二 
个 参数 传 入 的 函数 打印 每 一 个 元 素 。 将 next 字段 的 值 赋 给 节点 指针 ， 打 印 最 后 一 
个 节点 后 会 结束 : 


void displayLinkedList(LinkedList *list, DISPLAY display) { 
printf("\nLinked List\n"); 
Node *current = list->head; 
while (current != NULL) { 
display(current->data); 
current = current->next; 


} 
下 面 说 明 这 个 函数 用 6.4 节 中 开发 的 dispLayEmpLoyee 函数 打印 链表 : 
addHead(&linkedList, samuel); 


addHead(&linkedList, sally); 
addHead(&linkedList, susan); 





displayLinkedList(&linkedList, (DISPLAY)displayEmployee); 


这 段 代 码 的 输出 如 下 : 
Linked List 
Susan 45 
Sally 28 
Samuel 32 





6.4.2 ”用 指针 支持 队列 

队列 是 一 种 线性 数据 结构 ， 行 为 类 似 排队 。 它 通常 支持 两 种 主要 操作 : 入 队 和 出 队 。 
入 队 操 作 把 元 素 添 加 到 队列 中 ， 出 队 操 作 从 队列 中 删除 元 素 。 一 般 来 说 ， 第 一 个 添 
加 到 队列 中 的 元 素 也 是 第 一 个 离开 队列 的 元 素 ， 这 种 行为 被 称 为 先进 先 出 (FIFO)。 


实现 队列 经 常用 到 链表 。 入 队 操 作 就 是 将 市 点 添加 到 链表 头 ， 出 队 操 作 就 是 从 链表 
尾 删 除 节 点 。 为 了 说 明 队列 ， 我 们 会 用 到 6.4.1 市 中 开发 的 链表 。 


先 用 类 型 定义 语句 来 定义 队列 ， 它 基于 链表 ， 如 下 所 示 。 现 在 可 以 用 Queue 来 清晰 
地 表达 我 们 想 要 的 东西 了 : 


typedef LinkedList Queue; 











要 实现 初始 化 操作 ， 要 做 的 只 是 利用 initiaLizeList 函数 。 我 们 不 会 直接 调用 这 
个 函数 ， 而 是 使 用 下 面 的 initiaLizeQueue 函数 : 
void initializeQueue(Queue *queue) { 


initializeList(queue); 


} 
类 似 地 ， 下 面 的 代码 会 用 addHead 函数 向 队列 中 添加 一 个 节点 : 


void enqueue(Queue *queue, void *node) { 
addHead (queue, node); 


} 
之 前 实现 的 链表 没有 删除 尾 节 点 的 函数 ， 下 面 的 dequeue 函数 删除 最 后 一 个 节点 ， 
这 里 需要 处 理 以 下 三 种 情况 
。 空 队列 

返回 NULL 
单 节 点 队列 

由 else if 语句 处 理 
。 多 节点 队列 

由 etLse 分 支 处 理 
在 最 后 一 种 情况 中 ， 我 们 用 tmp 指针 来 一 个 节点 一 个 节点 地 前 进 ， 直 到 它 指 向 尾 节 
点 的 前 一 个 节点 ， 然 后 按 顺 序 执行 下 面 三 种 操作 : 
(1) 将 尾 节 点 赋值 为 tmp; 


(2) 将 tmp 指针 前 进 一 个 节点 ; 
(3) 将 尾 节 点 的 next 字段 置 为 NULL， 表 示 后 面 没有 节点 了 。 
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必须 按照 这 个 顺序 来 确保 链表 的 完整 性 ， 图 6-8 说 明了 原理 ， 带 圆圈 的 数字 对 应 上 
ey 





void *dequeue(Queue *queue) { 
Node *tmp = queue->head ; 


void *data; 
if (queue->head == NULL) { 
data = NULL; 
} else if (queue->head == queue->tail) { 


queue->head = queue->tail = NULL; 
data = tmp->data; 
free(tmp); 
} else{ 
while (tmp->next != queue->tail) { 
tmp = tmp->next,; 
} 
queue->tail = tmp; 
tmp = tmp->next; 
queue->tail->next = NULL; 
data = tmp->data; 
free(tmp); 
} 


return data; 








初始 状态 





第 1 步 之 后 的 状态 





第 2 步 之 后 的 状态 


next [mu] 第 3 步 之 后 的 状态 








next [wa] 

















返回 赋 给 节点 的 数据 后 节点 被 释放 。 下 面 的 代码 片段 用 前 面 创 建 的 雇员 信息 说 明 这 
些 国 数 的 用 法 : 


Queue queue 
initializeQueue(&queue); 


enqueue(&queue, samuel); 
enqueue(&queue, sally); 
enqueue(&queue, susan); 


void *data = dequeue(&queue); 

printf("Dequeued %s\n", ((Employee*) data)->name); 
data = dequeue(&queue); 

printf("Dequeued %s\n", ((Employee*) data)->name); 
data = dequeue(&queue); 

printf("Dequeued %s\n", ((Employee*) data)->name); 


输出 如 下 : 


Dequeued Samuel 
Dequeued Sally 
Dequeued Susan 


6.4.3 用 指针 支持 栈 

栈 数 据 结 构 也 是 一 种 链表 。 对 于 栈 ， 元 素 被 推 入 栈 顶 ， 然 后 被 弹出 。 当 多 个 元 素 被 
推 和 信和 弹出 时 ， 栈 的 行为 是 先进 后 出 (FILO)。 第 一 个 推 入 栈 的 元 素 最 后 一 个 弹出 。 
就 像 队列 的 实现 ， 我 们 可 以 用 链表 来 支持 栈 操作 。 最 常见 的 两 种 操作 是 入 栈 和 出 栈 。 
我 们 用 addHead 函数 实现 入 栈 操作 ， 出 栈 操作 需要 增加 一 个 新 函数 来 删除 头 节点 。 
我 们 先 定义 栈 : 





typedef LinkedList Stack; 
要 初始 化 栈 ， 需 要 添加 initializeStack 函数 ， 这 个 函数 调用 initiaLizeList 
国 数 : 

void initializeStack(Stack *stack) { 


initializeList(stack); 


} 


入 栈 操作 调用 addHead 函数 ， 如 下 所 示 : 
void push(Stack *stack, void* data) { 


addHead(stack, data); 
} 


下 面 是 出 栈 操作 的 实现 ， 我 们 先 把 栈 的 头 节 点 赋 给 一 个 节点 指针 ， 这 里 涉及 三 种 情况 。 
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。 栈 为 空 
国 数 返 回 NULL。 


。 栈 中 有 一 个 元 素 
如 果 节 点 指向 尾 节 点 ， 那 么 头 节点 和 尾 节 点 是 同一 个 元 素 。 将 头 节 点 和 尾 节 点 置 
为 NULL， 然 后 返回 数据 。 


。 栈 中 有 多 个 元 素 
在 这 种 情况 下 ， 我 们 将 头 节 点 赋值 为 链表 中 的 下 一 个 元 素 ， 然 后 返回 数据 。 


在 后 两 种 情况 下 ， 节 点 会 被 释放 


void *pop(Stack *stack) { 

Node *node = stack->head; 

if (node == NULL) { 
return NULL; 

} else if (node == stack->tail) { 
stack->head = stack->tail = NULL; 
void *data = node->data; 
free(node); 
return data; 

} else{ 
stack->head = stack->head->next; 
void *data = node->data; 
free(node); 
return data; 























} 


我 们 会 重复 利用 6.4.1 市 中 创建 的 雇员 实例 来 说 明 栈 的 用 法 。 下 面 的 代码 片段 会 把 
三 个 雇员 入 栈 再 出 栈 : 


Stack stack; 
initializeStack(&stack); 


push(&stack, samuel); 
push(&stack, sally); 
push(&stack, susan); 


Employee *employee; 


for(int i=0; i<4; i++) { 
employee = (Employee*) pop(&stack); 
printf("Popped %s\n", employee->name); 


} 

执行 后 得 到 如 下 输出 。 因 为 我 们 调用 了 四 次 出 栈 函 数 ， 最 后 一 次 会 返回 NULL: 
Popped Susan 
Popped Sally 


Popped Samuel 
Popped (null) 


有 时 候 还 有 其 他 的 栈 操作 ， 如 查看 栈 顶 元 素 ， 它 会 返回 栈 顶 的 元 素 ， 但 不 会 将 其 弹出 。 
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6.4.4 用 指针 支持 树 
树 是 很 有 用 的 数据 结构 ， 它 的 名 字源 于 元 素 之 间 的 关系 。 通 常 ， 子 节点 连接 到 父 节 
点 ， 从 整体 上 看 就 像 一 颗 倒 过 来 的 树 ， 根 节点 表示 这 种 数据 结构 的 开始 元 素 。 


树 可 以 有 任意 数量 的 子 节 点 ， 不过， 二 又 树 比 较 常见 ， 它 的 每 个 节点 能 有 0 个 、1 
个 或 是 2 个 子 市 点 。 子 市 点 要 么 是 左 子 闻 点 ， 要 么 是 右 子 市 点 。 没 有 子 市 点 的 节点 
称 为 叶子 市 点 ， 就 跟 树 叶 一 样 。 本 中 的 示例 会 闸 明 二 又 树 。 


指针 提供 了 一 种 维护 三 个 市 点 之 间 关 系 的 直观 、 动 态 的 方式 。 我 们 可 以 动态 分 配 市 
点 ， 将 其 按 需 插 入 树 中 。 这 里 使 用 下 面 的 结构 体 作为 节点 ， 借 助 void 指针 可 以 处 
理 我 们 需要 的 任意 类 型 的 数据 : 


typedef struct tree { 
void *data; 
struct tree *left; 
struct tree *right; 
} TreeNode; 











按照 特定 顺序 向 树 中 插入 节点 是 有 意义 的 ， 这 样 可 以 让 很 多 操作 (比如 搜索 ) 变 得 
容易 。 下 面 的 顺序 很 常见 : 插入 新 市 点 后 ， 这 个 节点 的 所 有 左 子 市 点 的 值 都 比 父 节 
点 小 ， 所 有 右 子 节点 的 值 都 比 父 节 点 的 值 大 ， 这 样 的 树 称 为 二 又 查找 树 。 


下 面 这 个 insertNode 国 数 会 把 一 个 节点 插入 二 又 查找 树 ， 不 过 ， 要 插入 节点 ， 首 
先 需 要 在 新 节点 和 已 有 节点 之 间 做 比较 。 我 们 用 COMPARE 函数 指针 来 传递 比较 函数 
的 地 址 ， 函 数 的 第 一 部 分 为 新 节点 分 配 内 存 并 把 数据 赋 给 市 点 。 因 为 新 节点 插入 树 
后 总 是 叶子 节点 ， 所 以 将 左 子 市 点 和 右 子 市 点 置 为 NULL: 


void insertNode(TreeNode **root, COMPARE compare, void* data) { 
TreeNode *node = (TreeNode*) malloc(sizeof (TreeNode)); 
node->data = data; 
node->left = NULL; 
node->right = NULL; 











if (*root == NULL) { 
*root = node; 
return; 


} 


while (1) { 
if (compare((*root)->data, data) > 0) { 
if ((*root)->left != NULL) { 
*root = (*root)->left; 
} else { 
(*root)->left = node; 
break; 


# 
} elsef{ 
if ((*root)->right != NULL) { 
*root = (*root)->right; 
} else { 
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(*root)->right = node; 
break; 


} 


首先 ， 检 查 根 节 点 来 判断 树 是 否 为 空 。 如 果 为 空 ， 那 么 就 把 新 节点 赋 给 根 节 点 ， 函 
数 返 回 。 根 节点 是 以 TreeNode 指针 的 指针 的 形式 传递 的 ， 这 是 必要 的 ， 因 为 我 们 
需要 修改 传 入 函数 的 指针 ， 而 不 是 指针 指向 的 对 象 。 我 们 已 经 在 1.4.1 节 中 详细 讨 
论 过 多 重 间 接 引 用 了 。 


如 果树 非 空 ， 程 序 就 进入 一 个 无 限 循环 ， 直 到 将 新 市 点 插入 树 中 结束 。 每 次 循环 达 
代 都 会 比较 新 证 点 和 当前 节点 ， 根 据 比较 结果 ， 将 局 部 root 指针 置 为 左 子 市 点 或 
者 右 子 节 点 ， 这 个 root 指针 总 是 指向 树 的 当前 闻 点 。 如 果 左 子 太 点 或 右 子 市 点 为 
空 ， 那 么 就 将 新 节点 添加 为 当前 节点 的 子 节 点 ， 循 环 结束 。 

为 了 说 明 insertNode 函数 ， 我 们 会 重用 6.4 节 中 创建 的 雇员 实例 。 下 面 的 代码 片 
段 初始 化 一 个 空 的 TreeNode， 然 后 插入 三 个 雇员 结构 体 ， 程 序 栈 的 结果 和 堆 的 状 
态 如 图 6-9 所 示 。 为 了 简化 这 个 图 ， 我 们 省 略 了 某 些 指向 雇员 结构 体 的 线 ， 并 调整 
了 节点 在 堆 中 的 位 置 ， 以 反映 树 结构 的 顺序 : 


TreeNode *tree = NULL; 















































insertNode(&tree, (COMPARE) compareEmployee, samuel); 
insertNode(&tree, (COMPARE) compareEmployee, sally); 
insertNode(&tree, (COMPARE) compareEmployee, susan); 


name 
age 





name [Sally name 
age age 


main 




















图 6-10 说 明了 这 棵 树 的 逻辑 结构 。 





| Samuel | 









左 子 节点 
| Susan | 








图 6-10: 树 的 逻辑 组 织 





二 叉 树 可 以 满足 多 种 需求 ， 遍 历 二 又 树 的 方式 有 三 种 : 前 序 、 中 序 和 后 序 。 三 种 技 


术 步 又 相 同 ， 但 顺序 不 同 。 三 个 步骤 如 下 : 


。 访问 节点 
处 理 节 点 





。 往 左 
转移 到 左 子 节 点 

。 往 右 
转移 到 右 子 节点 


对 我 们 来 说 ， 访 问 节 点 的 目的 是 打印 其 内 容 。 访 问 节 点 的 三 种 顺序 如 下 所 示 。 


。 中 序 
先 往 左 ， 访 问 节 点 ， 再 往 右 。 
。 前 序 





访问 节点 ， 往 左 ， 再 往 右 。 


。 后 序 
先 往 左 ， 再 往 右 ， 最 后 访问 节点 。 








函数 的 实现 如 下 ， 所 有 的 函数 的 参数 都 是 树 根 和 作为 打印 函数 的 一 个 函数 指针 ， 它 
们 都 是 递归 的 。 只 要 传 入 的 根 节 点 非 空 就 会 调用 自身 ， 不 同 点 只 在 于 执行 三 步 操作 


的 顺序 : 


void inOrder(TreeNode *root, DISPLAY display) { 
if (root != NULL) { 
inOrder(root->left, display); 
display(root->data); 
inOrder(root->right, display); 
} 
} 


void postOrder(TreeNode *root, DISPLAY display) { 
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if (root != NULL) { 
postOrder(root->left, display); 
postOrder(root->right, display); 
dispLay(root->data) ; 
} 
上 


void preOrder(TreeNode *root, DISPLAY display) { 
if (root != NULL) { 
display(root->data); 
preOrder(root->left, display); 
preOrder(root->right, display); 
} 
} 


下 面 的 代码 片段 调用 这 些 函 数 : 
preOrder(tree, (DISPLAY) displayEmployee); 


inOrder(tree, (DISPLAY) displayEmployee); 
postOrder(tree, (DISPLAY) displayEmployee); 





表 6-1 显示 的 是 基于 前 面 初始 化 的 树 每 次 函数 调用 的 输出 。 
表 6-1: 遍历 技术 


前 序 Samuel 32 Sally 28 Susan 45 
中 序 Sally 28 Samuel 32 Susan 45 
后 序 Sally 28 Susan 45 Samuel 32 











中 序 遍 历 会 返回 树 成 员 的 排序 列表 ， 前 序 和 后 序 遍历 跟 栈 和 队列 配合 使 用 可 以 计算 
算术 表达 式 。 


6.5 小结 

指针 的 强大 和 灵活 在 创建 和 支持 数据 结构 的 过 程 中 体现 得 淋漓 尽 臻 。 指 针 跟 动态 分 
配 结构 体内 存 相 结合 ， 确 保 了 数据 结构 的 创建 对 内 存 的 使 用 高 效 、 可 伸缩 ， 从 而 满 
足 应 用 程序 的 需求 。 

本 章 一 开始 讨论 了 如 何 分 配 结构 体 的 内 存 ， 需 要 注意 的 是 ， 结 构 体 字段 之 间 和 结构 
体 数 组 之 间 可 能 存在 填充 。 动 态 内 存 分 配 和 释放 的 开销 可 能 很 大 ， 我 们 研究 了 一 种 
维护 结构 体 池 的 技术 来 确保 开销 最 小 。 

我 们 也 讲 到 了 几 种 常用 的 数据 结构 的 实现 ， 其 中 有 几 种 使 用 链表 支持 。 通 过 在 运行 
时 确定 比较 函数 和 打印 函数 ， 函 数 指 针 将 这 些 实现 变 得 更 加 灵活 。 
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安全 问题 和 指针 误 用 





很 少 有 应 用 程序 不 需要 关注 安全 性 和 可 靠 性 ， 而 频繁 的 安全 漏洞 报告 和 应 用 程序 故 
障 会 加 强 这 种 关注 。 巩 固 应 用 程序 安全 性 的 责任 基本 落 在 了 开发 者 身上 。 在 本 章 中 ， 
我 们 会 研究 让 应 用 程序 更 安全 可 靠 的 实践 。 


因为 C 的 某 些 特性 ， 用 C 写 安 全 的 应 用 程序 跟 用 其 他 语言 有 所 不 同 。 比 如 说 ，C 不 
会 阻止 程序 员 越过 数组 边界 写 入 ， 这 样 会 导致 内 存 损坏 ， 也 会 引发 安全 风险 。 此 外 ， 
误 用 指针 通常 也 是 很 多 安全 问题 的 根本 原因 。 


如 果 应 用 程序 的 行为 和 预期 不 一 致 ， 这 可 能 不 是 安全 问题 ， 至 少 未 授权 访问 就 是 这 
种 情况 。 不 过 ， 有 时 候 这 种 行为 可 能 会 被 利用 ， 从 而 导致 拒绝 服务 ， 进 而 危害 应 用 
程序 。 误 用 指针 导致 的 非 预 期 行为 已 经 在 本 书 其 他 部 分 讲 过 了 ， 本 章 还 会 讲 到 更 多 
的 指针 误 用 。 

















CERT 组 织 (http://www.cert.org/) 是 了 解 C 和 其 他 语言 安全 问题 全 面 解决 方案 的 
好 来 源 。 这 个 组 织 研 究 互 联网 安全 漏洞 ， 我 们 主要 关注 跟 指针 相关 的 安全 问题 。 
CERT 组织 研究 的 很 多 安全 问题 都 能 追根 渊源 到 指针 的 误 用 。 理 解 指针 和 使 用 指针 
的 恰当 方法 是 开发 安全 可 靠 的 应 用 程序 的 重要 工具 。 其 中 部 分 主题 已 经 在 前 面 的 章 
节 中 提 到 过 了 ， 可 能 不 是 从 安全 角度 而 是 从 编程 实践 的 角度 出 发 的 。 


操作 系统 (OS) 已 经 引入 了 一 些 安全 改进 ， 有 些 改进 反映 在 内 存 的 使 用 方式 上 。 尽 
管 这 些 改进 通常 超出 了 开发 者 的 控制 范围 ， 但 是 它们 确实 会 影响 程序 。 理 解 这 些 问 
题 有 助 于 解释 应 用 程序 的 行为 。 我 们 会 把 精力 集中 在 地 址 空间 布局 随机 化 和 数据 执 
行 保护 上 。 
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地 址 空间 布局 随机 化 (Address Space Layout Randomization，ASLR) 过 程 会 把 应 用 
程序 的 数据 区 域 随机 放置 在 内 存 中 ， 这 些 数据 区 域 包括 代码 、 栈 和 堆 。 随 机 放置 这 
些 区 域 导 致 攻击 者 更 难 预测 内 存 的 位 置 ， 从 而 更 难 利用 它们 。 有 些 类 型 的 攻击 〈 比 
如 说 return-to-libc 攻击 )， 会 覆 写 栈 的 一 部 分 ， 然 后 把 控制 转移 到 这 个 区 域 。 这 个 区 域 
经 党 是 共享 C 库 libc。 如 果 栈 和 libc 的 位 置 是 未 知 的 ， 这 类 攻击 的 成 功率 就 会 降低 。 








如 果 代 码 位 于 内 存 的 不 可 执行 区 域 ， 数据 执行 保护 (Data Execution Prevention ， 
DEP) 技术 会 阻止 执行 这 些 代码 。 在 有 些 类 型 的 攻击 中 ， 恶 意 代 码 会 履 写 内 存 的 某 
个 区 域 ， 然 后 将 控制 转移 到 这 个 区 域 。 如 果 这 个 区 域 (比如 栈 或 是 堆 ) 的 代码 不 可 
执行 ， 那么 恶意 代码 就 无 法 执行 了 。 这 种 技术 可 以 用 硬件 实现 ， 也 可 以 用 软件 实现 。 


本 章 会 从 以 下 几 个 角度 研究 安全 问题 : 


。 声明 和 初始 化 指针 ， 
。 误 用 指针 ， 
。 释放 问题 。 


7.1 指针 的 声明 和 初始 化 


在 声明 和 初始 化 指针 时 可 能 会 出 现 问题 ， 更 准确 地 说 ， 指 针 初 始 化 失败 。 在 本 市 中 ， 
我 们 会 研究 出 现 这 类 问题 的 情况 。 














7.1.1 不 恰当 的 指针 声明 
考虑 如 下 声明 : 

int* ptrl, ptr2; 
声明 本 身 没 错 ， 不 过 ， 可 能 跟 我 们 的 本 意 不 同 ， 它 把 ptrl 声明 为 整数 指针 ， 而 把 
ptr2 声明 为 整数 。 我 们 将 星 号 有 意 紧 挨 着 数据 类 型 ， 而 ptrl 前 面 则 加 了 空格 。 这 
样 的 位 置 对 编译 器 来 说 没有 区 别 ， 但 是 对 于 读 代 码 的 人 来 说 ， 可 能 暗示 着 ptrl 和 
ptr2 都 是 整数 指针 。 然 而 ， 只 有 ptrl 是 指针 。 
在 同一 行 中 把 两 个 变量 都 声明 为 指针 的 正确 写法 如 下 所 示 : 


INnt wptrL ptr2, 











4 每 个 变量 声明 独占 一 行 更 好 。 
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用 类 型 定义 代替 宏 定 义 是 另 一 个 好 习惯 。 类 型 定义 允许 编译 器 检查 作用 域 规则 ， 而 
宏 定 义 不 一 定 会 。 

我 们 可 以 使 用 宏 指 令 辅助 声明 变量 ， 如 下 所 示 。 在 这 里 ，define 指令 包装 了 整数 
指针 ， 并 用 它 来 声明 变量 : 


#define PINT int* 
PINT ptrl, ptr2; 























不 过 ， 结 果 就 跟前 面 所 说 的 一 样 。 更 好 的 方法 是 用 下 面 的 类 型 定义 : 





typedef int* PINT; 
PINT ptrl, ptr2; 


两 个 变量 均 被 声明 为 整数 指针 。 


7.1.2 使 用 指针 前 未 初始 化 
在 初始 化 指针 之 前 就 使 用 指针 会 导致 运行 时 错误 ， 有 时 候 将 这 种 指针 称 为 野 指针 。 
下 面 这 个 简单 的 例子 声明 了 一 个 整数 指针 ， 但 是 使 用 之 前 没有 为 其 赋值 





int *pi; 
printf("%d\n",*pi); 


图 7-1 说 明了 此 时 的 内 存 分 配 情况 。 














pi100 | … | 
104| .. | 
图 7-1: 野 指 针 


这 里 没有 初始 化 pi 变量 ， 因 此 它 会 包含 垃圾 数据 (在 图 中 用 省 略 号 表示 )。 如 果 pi 
中 的 内 存 地 址 超出 了 应 用 程序 的 合法 地 址 空间 ， 这 段 代码 很 可 能 会 在 执行 过 程 中 终 
止 。 和 否则 打印 出 来 的 就 是 恰好 位 于 那个 地 址 的 数据 (不管 具体 是 什么 ) ， 而 且 会 表示 
为 整数 。 如 果 我 们 用 的 是 字符 串 指针 ， 就 经 常会 看 到 打印 出 奇怪 的 字符 〈 直 到 遇 到 
末尾 的 0 才 停 止 )。 

















7.1.3 ”处理 未 初始 化 指针 
指针 本 身 并 不 能 告诉 我 们 它 是 否 有 效 ， 所 以 ， 不 能 只 靠 检查 指针 的 内 容 来 判断 它 是 
否 有 效 。 不 过 ， 有 三 种 方法 可 以 用 来 处 理 未 初始 化 的 指针 
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。 总 是 用 NULL 来 初始 化 指针 ; 

。 用 assert 国 数 ; 

。 用 第 三 方 工具 。 

把 指针 初始 化 为 NULL 更 容易 检查 是 否 使 用 正确 。 即 便 这 样 ， 检 查 空 值 也 比较 麻烦 ， 
如 下 所 示 : 


int *pi = NULL; 





if(pi == NULL) { 
// 不 应 该 解 引 pi 
} else { 
// 可 以 使 用 pi 
} 
我 们 可 以 用 assert 函数 来 测试 指针 是 否 为 空 值 。 下 例 测 试 了 pi 变量 是 否 为 空 值 。 
如 果 表 达 式 为 真 ， 那 么 什么 都 不 会 发 生 ， 如 果 表 达 式 为 假 ， 程 序 会 终止 。 这 样 ， 指 
针 为 空 的 话 程序 就 会 终止 


assert(pi != NULL); 


对 于 应 用 程序 的 调试 版 本 ,这 种 方法 可 能 可 以 接受 。 如 果 指 针 是 空 值 ， 输 出 类 似 
下 面 : 























J 


Assertion failed: pi != NULL 
我 们 在 assert.h 头 文件 中 声明 assert 函数 。 


可 使 用 第 三 方 工具 来 帮助 定位 这 类 问题 ， 此 外 ， 有 些 编译 器 选项 也 比较 有 用 ，7.4 市 
会 讲 到 。 


7.2 ”指针 的 使 用 问题 


在 本 节 中 ， 我 们 会 研究 解 引 操作 和 数组 下 标的 误 用 ， 也 会 研究 跟 字 符 串 、 结 构 体 和 
函数 指针 有 关 的 问题 。 


很 多 安全 问题 聚焦 的 是 缓冲 区 溢出 的 概念 。 履 写 对 象 边界 以 外 的 内 存 就 会 导致 缓冲 
区 溢出 ， 这 块 内 存 可 能 是 本 程序 的 地 址 空间 ， 也 可 能 是 其 他 进程 的 ， 如 果 是 程序 地 
址 空间 以 外 的 内 存 ， 大 部 分 操作 系统 会 发 出 一 个 段 错误 然后 终止 程序 。 因 为 这 个 原 
因 恶 意 引发 的 终止 本 身 就 是 拒绝 服务 攻击 ， 这 类 攻击 不 会 获取 未 授权 的 访问 ， 但 会 
试图 搞 震 应 用 程序 其 至 是 服务 器 


如 果 缓 冲 区 溢出 发 生 在 应 用 程序 的 地 址 空间 内 ， 就 会 导致 对 数据 的 未 授权 访问 和 


























(或 ) 控制 转移 到 其 他 代码 段 ， 于 是 就 可 能 攻陷 系统 。 以 超级 用 户 权限 运行 应 用 程序 
更 要 加 倍 小 心 。 


下 面 几 种 情况 可 能 导致 缓冲 区 溢出 : 


。 访问 数组 元 素 时 没有 检查 索引 值 ; 

。 对 数组 指针 做 指针 算术 运算 时 不 够 小 心 ; 

。 用 gets 这 样 的 函数 从 标准 输入 读 取 字 符 串 ， 
。 误 用 strcpy 和 strcat 这 样 的 函数 。 


如 果 缓 冲 区 溢出 发 生 在 栈 帧 的 元 素 上 ， 就 可 能 把 栈 帧 的 返回 地 址 部 分 履 写 为 对 同 
一 时 间 创 建 的 恶意 代码 的 调用 。 查 看 3.1 节 来 获取 关于 栈 帧 的 详细 信息 。 国 数 返 
回 时 会 将 控制 转移 到 恶意 国 数 ， 该 函数 可 以 执行 任何 操作 ， 只 受 限于 当前 用 户 的 
特权 等 级 。 

















7.2.1 测试 NULL 
用 malloc 这 类 函数 时 一 定 要 检查 返回 值 ， 否 则 可 能 会 导致 程序 非 正 常 终 止 。 下 面 
说 明 一 般 的 方法 : 








float *vector = malloc(20 * sizeof (float)); 
if(vector == NULL) { 
// malloc 分配 内 存 失 败 
} else{ 
// 处 理 vector 
} 


7.2.2 ”错误 使 用 解 引 操作 
声明 和 初始 化 指针 的 常用 方法 如 下 : 


int num; 
int *pi = &num; 


下 面 是 一 种 看 似 等 价 的 声明 方法 : 


int num; 

int *pi; 

*pi = &num; 
不 过 ， 这 样 是 错误 的 ， 注 意 最 后 一 行 的 解 引 操作 。 我 们 试图 把 num 的 地 址 赋 给 pi 
所 指 问 的 内 存 地 址 (而 不 是 pi)。 指 针 pi 还 没有 被 初始 化 。 我 们 犯 了 一 个 简单 的 错 
误 , 误 用 了 解 引 操作 ， 正 确 的 写法 如 下 : 
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int num; 
int *pi; 
pi = &num; 


在 原声 明 int *pi = &num 中 ， 星 号 把 变量 声明 为 指针 ， 而 不 是 解 引 操作 。 








7.2.3 ”迷途 指针 

释放 指针 后 却 仍 然 在 引用 原来 的 内 存 ， 就 会 产生 迷途 指针 ， 这 个 问题 已 经 在 2.4 市 
中 详细 讲 过 了 。 如 果 之 后 试图 访问 这 块 内 存 ， 其 内 容 可 能 已 经 改变 。 对 这 块 内 存 进 
行 写 操作 可 能 会 损坏 内 存 ， 而 读 操 作 则 可 能 返回 无 效 数据 ， 这 两 种 情况 都 可 能 导致 
程序 终止 。 

















直到 最 近 ， 这 才 被 认为 是 一 个 安全 问题 。 正 如 迷途 指针 (https://www.blackhat.com/ 
presentations/bh-usa-07/Afek/Whitepaper/bh-usa-07-afek-WP.pdf) 中 所 讲 的 那样 ， 存 
在 利用 迷途 指针 的 可 能 性 。 不 过 ， 这 种 方法 建立 在 利用 C++ 中 的 VTable ( 虚 表 ) 
的 前 提 下 。 虚 表 是 函数 指针 的 数组 ， 用 来 支持 C++ 的 虚 方法 。 除 非 使 用 涉及 国 数 指 
针 的 类 似 方 法 ， 否 则 在 C 中 这 应 该 不 会 有 问题 。 








7.2.4 ”越过 数组 边界 访问 内 存 
没有 什么 可 以 阻止 程序 访问 为 数组 分 配 的 空间 以 外 的 内 存 。 在 本 例 中 ， 我 们 声明 并 
初始 化 了 三 个 数组 来 说 明 这 种 行为 。 假 设 数组 分 配 在 连续 的 内 存 位 置 。 

char firstName[8] = "1234567" 


char middleName[8] = "1234567" 
char lastName[8] = "1234567" 





middleName[-2] = 
middleName[0] = 
middleName[10] = 


printf("%p %s\n",firstName,firstName); 
printf("%p %s\n",middleName,middleName); 
printf("%p %s\n",lastName, lastName); 


为 了 说 明 如 何 履 写 内 存 ， 将 三 个 数组 初始 化 为 简单 的 数字 。 程 序 的 行为 会 随 着 编译 
器 和 机 器 而 变化 ， 但 是 这 段 代 码 应 该 能 正常 运行 并 履 写 frstName 和 TastName 中 
的 字符 ， 输 出 如 下 。 图 7-2 说 明了 内 存 分 配 情 况 。 

116 12X4567 


108 X234567 
100 123456X 











lastName 100 
104 4 一 middleName[-2] 
middleName 108 <— middleName[0] 
112 | 5670 | 


firstName 116 | 12X4 | 所 一 middleName[10] 


120 | 5670 | 














7-2: 使 用 无 效 的 数组 索引 
第 4 章 解释 过 ， 用 下 标 计算 的 地 址 不 会 检查 索引 值 ， 这 就 是 一 个 简单 的 缓冲 区 溢出 。 


7.2.5 “错误 计算 数组 长 度 

将 数组 传递 给 函数 时 ， 一 定 要 同时 传递 数组 长 度 。 这 个 信息 帮助 函数 避免 越过 数组 
边界 。 在 下 面 的 replace 国 数 中 ， 将 字符 串 的 地 址 随 着 替换 用 的 字符 以 及 缓冲 区 长 
度 一 块 传人 和信， 函数 的 目的 是 把 字符 串 中 所 有 的 字符 都 替换 为 传人 的 字符 ， 直 到 NUL 
字符 。 长 度 参数 防止 函数 越过 缓冲 区 写 入 : 











void replace(char buffer[], char replacement, size t size) { 
size t count = 0; 


while(*buffer != NUL &é& count++<size) { 
*buffer = replacement; 
buffer++; 

} 


} 


在 下 面 的 代码 中 ，name 数组 最 多 只 能 装 7 个 字符 再 加 上 NUL 字符。 不过， 我 们 有 
意 越 过 数组 边界 写 入 来 说 明 replace 函数 的 工作 原理 。 我 们 给 replace 国 数 传递 
了 name 和 替换 字符 +: 

char name[8]; 

strcpy (name, "Alexander"); 


replace(name, '+' ,sizeof (name)); 
printf("%s\n", name); 





执行 代码 后 得 到 如 下 输出 : 


十 十 十 十 十 十 十 十 





只 是 向 数组 添加 了 8 个 加 号 ，strcpy 国 数 允 许 缓冲 区 溢出 ， 但 是 replace 国 数 不 
允许 ， 前 提 还 是 假设 传 入 的 长 度 信 息 有 效 。 要 谨慎 使 用 strcpy 这 类 不 传递 缓冲 区 
长 度 的 函数 。 传 递 缓冲 区 长 度 能 提供 额外 的 安全 屏障 。 
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7.2.6 ”错误 使 用 sizeof 操 作 符 
错误 使 用 sizeof 操作 符 的 一 个 例子 是 试图 检查 指针 边界 但 方法 错误 。 下 例 为 整数 
数组 分 配 内 存 ， 然 后 把 每 个 元 素 初 始 化 为 0: 

int buffer[20]; 

int *pbuffer = buffer; 

for(int i=0; i<sizeof (buffer); i++) { 


*(pbuffer++) = 0; 
} 


不 过 ，sizeof (buffer) 表达 式 返 回 了 80， 因 为 缓冲 区 长 度 以 字 节 计 是 80 (20 乘 
以 4 字 节 每 元 素 )。for 循环 执行 了 80 次 而 不 是 20 次 ， 这 很 可 能 会 导致 内 存 访 问 
异常 ， 从 而 终止 应 用 程序 。 可 以 在 for 表达 式 的 测试 条 件 中 用 sizeof (buffer)/ 
sizeof(int) 来 避免 这 个 问题 。 








7.2.7 一 定 要 匹配 指针 类 型 
总 是 用 合适 的 指针 类 型 来 装 数据 是 个 好 主意 。 为 了 说 明 可 能 存在 的 陷阱 ， 考 虑 下 面 
的 代码 。 将 一 个 整数 指针 赋值 给 一 个 短 整 数 指针 ; 





int num = 2147483647 ; 
int *pi = &num; 
Short *ps = (short*)pi; 
printf("pi: %p Value(16): %x Value(10): %d\n", pi, *pi, *pi); 
printf("ps: %p Value(16): %hx Value(10): %hd\n", 
ps, (unsigned short)*ps, (unsigned short)*ps); 


这 段 代 码 的 输出 如 下 : 


pi: 100 Value(16): 7fffffff Value(10): 2147483647 
ps: 100 Value(16): ffff Value(10): -1 


注意 ， 看 起 来 地 址 100 处 的 第 一 个 十 六 进 制 数字 要 么 是 7， 要 么 是 f， 这 取决 于 它 是 
以 整数 还 是 短 整 数 显示 。 这 个 明显 的 矛盾 是 在 小 字 节 序 机 器 上 运行 代码 的 结果 。 图 
7-3 说 明了 地 址 100 处 的 常量 的 内 存 布 局 。 
































100 101 102 103 











图 7-3: 不 匹配 的 指针 类 型 

如 果 我 们 把 它 当 做 短 整 数 ， 那 就 只 用 前 两 个 字 节 ， 于 是 就 得 到 了 短 整 数值 -1。 如 果 
我 们 把 它 当做 整数 ， 就 会 用 4 个 字 节 ， 于 是 得 到 2 147 483 647。 这 类 微妙 的 问题 正 
是 导致 C 和 指针 如 此 难 的 原因 。 


























A 
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7.2.8 有 界 指针 


有 界 指针 是 指 指针 的 使 用 被 限制 在 有 效 的 区 域内 。 比 如 说 ， 现 在 有 一 个 32 个 元 素 的 
数组 ， 禁 止 对 这 个 数组 使 用 的 指针 访问 数组 前 面 或 后 面 的 任何 内 存 。 


C 没有 对 这 类 指针 提供 直接 支持 。 不 过 ， 程 序 员 可 以 显 式 地 确保 这 个 限制 得 以 执行 ， 
如 下 所 示 : 


#define SIZE 32 


char name[SIZE]; 
char *p = name; 
if(name != NULL) { 
if(p >= name && p < name+SIZE) { 
// 有 效 指针 ， 继 续 
} else{ 
// 无 效 指针 ， 错 误 分 支 
} 
} 


这 种 方法 比较 麻烦 ， 相 较 而 言 ，7.4 市 中 讨论 的 静态 分 析 可 能 会 比较 有 用 。 


一 种 有 趣 的 变化 是 创建 一 个 指针 检验 函数 (https://www.securecoding.cert.org/ 
confluence/display/seccode/MEM10-C.+Define+and+use+a+pointer+validation+function ) ， 


要 这 么 做 ， 必 须知 道 初始 的 位 置 和 范围 。 





另 一 种 方法 是 利用 ANSI-C 和 C++ 的 边界 模型 检查 工具 (CBMC，http:/www. 
cprover.org/cbmc/) 。 这 个 应 用 程序 会 对 C 程序 做 一 些 安全 问题 检查 ， 然 后 发 现 数组 
边界 和 缓冲 区 溢出 的 问题 。 


考 3 


C++ 中 的 智能 指针 提供 了 一 种 模仿 指针 同时 支持 边界 检查 的 方法 ， 不 幸 的 
、 是 ，C 没有 智能 指针 。 








7.2.9 字符 串 的 安全 问题 
字符 串 相 关 的 安全 问题 一 般 发 生 在 越过 字符 串 末尾 写 入 的 情况 。 在 本 节 中 ， 我 们 主 
要 关注 可 能 造成 这 种 问题 的 “标准 ”函数 。 





如 果 使 用 strcpy 和 strcat 这 类 字符 串 函 数 ， 稍 不 留神 就 会 引发 缓冲 区 洪 出 。 已 
经 有 人 提出 一 些 方法 来 取代 ， 但 都 没有 得 到 广泛 认可 。strncpy 和 strncat 函数 
可 以 对 这 种 操作 提供 一 些 支持 ， 它 们 的 size_t 参数 指定 要 复制 的 字符 的 最 大 数量 。 
不 过 ， 如 果 字 符 数 量 计算 不 正确 ， 替 代 函 数 也 容易 出 错 。 
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Cll 中 (Annex K) 加 入 了 strcat s 和 strcpy s 国 数 ， 如 果 发 生 缓 冲 区 滋 
出 ， 它 们 会 返回 错误 ， 目 前 只 有 Microsoft Visual C++ 支持。 下面 这 个 例子 说 明了 
strcpy_s 国 数 的 使 用 ， 它 接受 三 个 参数 : 目标 缓冲 区 、 目 标 缓冲 区 的 长 度 以 及 源 
缓冲 区 。 如 果 返 回 值 是 0 就 表示 没有 错误 发 生 。 不 过 在 本 例 中 会 有 错误 发 生 ， 因 为 
源 缓冲 区 太 大 了 ， 有 目标 缓冲 区 装 不 下 : 























char firstName [8]; 
int result; 
result = strcpy s(firstName,sizeof (firstName),"Alexander"); 


还 有 scanf_s 和 wscanf_s 函数 可 以 用 来 防止 缓冲 区 溢出 。 


gets 函数 从 标准 输入 读 取 一 个 字符 串 ， 并 把 字符 保存 在 目标 缓冲 区 中 ， 它 可 能 会 越 
过 缓冲 区 的 声明 长 度 写 入 。 如 果 字 符 串 太 长 的 话 ， 就 会 发 生 缓冲 区 溢出 。 


有 些 Linux 系统 也 支持 strlcpy 和 strlcat 函数 ,但 GNU C 库 不 支持 。 有 人 认为 
这 两 个 函数 制造 的 问题 比 解决 的 还 多 ， 而 且 文 档 不 全 。 

使 用 某 些 函数 可 能 造成 攻击 者 用 格式 化 字符 串 攻 击 的 方法 访问 内 存 。 在 这 类 攻击 中 ， 
将 用 户 提 供 的 格式 化 字符 串 (如 下 所 示 ) 打造 得 可 以 访问 内 存 ， 甚 至 能 够 注入 代码 。 
在 这 个 简单 的 程序 中 ， 我 们 将 第 二 个 命令 行 参数 作为 printf 函数 的 第 一 个 参数 : 





int main(int argc, char** argv) { 
printf(argv[1]); 


} 
这 个 程序 可 以 用 类 似 于 下 面 的 命令 执行 : 
main.exe "User Supplied Input" 
输出 类 似 于 : 


User Supplied Input 


程序 本 身 无 害 ,， 但 是 精巧 的 攻击 真 的 可 以 造成 损害 。 这 里 不 会 就 这 个 话题 展开 ， 不 
过 ， 如 何 实现 这 样 的 攻击 可 以 在 hackerproof.org 上 找到 。 
printf、fprintf、snprintf 和 syslog 这 些 函 数 都 接受 格式 化 字符 串 作 为 参数 ， 
避免 这 类 攻击 的 一 种 简单 方法 是 永远 不 要 把 用 户 提供 的 格式 化 字符 串 传 给 这 些 国 数 。 


7.2.10 “指针 算 术 运 算 和 结构 体 
我 们 应 该 上 只 对 数组 使 用 指针 算术 运算 ， 因 为 数组 肯定 分 配 在 连续 的 内 存 块 上 ， 指 针 
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算术 运算 可 以 得 到 有 效 的 偏 移 量 。 不 过 ， 不 应 该 将 它们 用 在 结构 体内 ， 因 为 结构 体 
的 字段 可 能 分 配 在 不 连续 的 内 存 区 域 。 


下 面 这 个 结构 体 说 明了 这 一 点 。 为 name 字段 分 配 10 字 节 ， 之 后 是 一 个 整数 。 然 
而 ， 整 数 是 对 齐 到 4 字 节 边界 的 ， 所 以 两 个 字段 之 间 会 有 空隙 。 这 类 空 队 在 6.1 市 
的 “结构 体 的 内 存 如 何 分 配 ” 中 解释 过 了 。 





typedef struct employee { 
char name[10]; 
int age; 

} Employee; 


下 面 的 代码 试图 用 指针 来 访问 结构 体 的 age 字段 : 


Employee employee; 

// 初始 化 empLoyee 

char *ptr = employee.name; 
ptr += sizeof (employee.name); 


指针 包含 地 址 110， 这 是 两 个 字段 之 间 的 2 字 节 的 地 址 ， 解 引 指 针 会 把 地 址 110 处 
的 4 字 节 当做 整数 ， 如 图 7-4 所 示 。 





name 100 
104 

108 

age 112 











图 7-4: 结构 体 填充 示例 





误 用 对 齐 的 指针 可 能 会 导致 程序 非 正常 终止 或 是 取 到 错误 数据 。 此 外 ， 如 
一 CR》 采编 译 器 需要 生成 额外 的 机 器 码 来 弥补 不 恰当 的 对 齐 ， 那 么 指针 访问 也 可 


会 加 F 全 
能 变 慢 。 














即使 结构 体内 的 内 存 是 连续 的 ， 用 指针 算术 运算 来 访问 结构 体 的 字段 也 不 是 好 做 法 。 
下 面 的 结构 体 定 义 了 由 三 个 整数 组 成 的 Item， 通 常会 将 三 个 整数 字段 分 配 在 连续 的 
内 存 位 置 ， 不 过 也 不 一 定 : 
typedef struct item { 
int partNumber; 
int quantity; 


int binNumber; 
}Item; 


下 面 的 代码 片段 声明 了 一 个 部 件 ， 然 后 用 指针 算术 运算 访问 每 个 字段 : 
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Item part = {12345, 35, 107}; 
int *pi = &part.partNumber; 
printf("Part number: %d\n",*pi); 
pi+t+; 

printf("Quantity: %d\n",*pi); 
pi+t+; 

printf("Bin number: %d\n",*pi); 


通常 ， 输 出 就 是 我 们 所 期 望 的 那样 ， 但 也 有 例外 。 更 好 的 办 法 是 把 每 个 字段 赋 给 pi: 





int *pi = &part.partNumber; 
printf("Part number: %d\n",*pi); 
pi = &part.quantity; 
printf("Quantity: %d\n",*pi); 

pi = &part.binNumber; 
printf("Bin number: %d\n",*pi); 


更 好 的 办 法 是 根本 不 用 指针 ， 如 下 所 示 : 


printf("Part number: %d\n",part.partNumber); 
printf("Quantity: %d\n",part.quantity); 
printf("Bin number: %d\n",part.binNumber); 


7.2.11 函数 指针 的 问题 
函数 和 函数 指针 用 来 控制 程序 的 执行 顺序 ， 但 是 它们 可 能 会 被 误 用 ， 导 致 不 可 预期 
的 行为 。 考 虑 下 面 的 getSystemStatus 函数 的 使 用 ， 它 返回 反应 系统 状态 的 整数 : 





int getSystemStatus() { 
int status; 


return status; 


} 
下 面 是 判断 系统 状态 是 否 为 0 的 最 好 方法 : 


if(getSystemStatus() == 0) { 
printf("Status is ONn'" ) ; 
} else { 
printf("Status is not 0\n"); 
3 


接 下 来 这 个 例子 中 ， 忘 记 了 加 上 括号 ， 这 段 代 码 不 会 正常 执行 : 


if(getSystemStatus == 0) { 
printf("Status is ONn'" ) ; 

} else { 
printf("Status is not 0\n"); 








不 是 调用 函数 后 比较 返回 值 和 0。 记 住 ， 只 用 函数 名 本 身 时 返回 的 是 函数 的 地 址 。 
一 个 类 似 的 错误 是 直接 使 用 函数 返回 值 ， 而 不 会 将 它 的 结果 和 其 他 值 进 行 比较 ， 这 
样 会 返回 地 址 然后 计算 真 假 ， 而 函数 的 地 址 不 大 可 能 是 0， 结 果 就 是 返回 的 地 址 计 
算 为 真 ， 因 为 C 把 非 0 值 都 作为 真 ， 


if(getSystemStatus) { 
// 永远 为 真 
} 


我 们 应 该 像 下 面 这 样 写 函数 调用 来 判断 状态 是 否 为 0: 




















if(getSystemStatus()) { 


如 果 函 数 和 函数 指针 的 签名 不 同 ， 不 要 把 函数 赋 给 函数 指针 ， 这 样 会 导致 未 定义 的 
行为 ， 一 个 误 用 的 例子 如 下 所 示 : 





int (*fptrCompute) (int,int); 
int add(int nl, int n2, int n3) { 
return nl+n2+n3; 


} 


fptrCompute = add; 
fptrCompute(2,5); 





我 们 试图 只 用 两 个 参数 调用 add 函数 ， 而 该 函数 期 望 的 是 三 个 参数 ， 代 码 能 编译 ， 
但 是 输出 是 不 确定 的 。 

国 数 指针 可 以 执行 不 同 的 国 数 ， 这 取决 于 分 配给 它 的 地 址 。 比 如 说 ， 我 们 可 能 想 为 
一 般 的 操作 使 用 printf 函数 ， 但 是 有 时 候 为 了 打印 特定 日 志 需 要 换 成 别 的 国 数 ， 
那么 可 以 像 下 面 这 样 声 明 并 使 用 函数 指针 : 





int (*fptrIindirect)(const char *, ...) = printf; 
fptrIndirect("Executing printf indirectly"); 














攻击 者 可 能 用 缓冲 区 溢出 来 履 写 函数 指针 的 地 址 ， 如 果 发 生 这 类 攻击 ， 控 制 可 能 
转移 到 内 存 中 的 任意 位 置 。 


7.3 内存 释放 问题 

即便 已 经 释放 了 内 存 ， 我 们 也 不 一 定 要 用 完 指针 或 已 释放 的 内 存 。 有 一 个 问题 是 : 
如 果 将 同一 块 内 存 释 放 两 次 会 发 生 什 么 。 此 外 ,一 旦 释放 内 存 ， 我 们 可 能 就 得 保护 
留 下 的 数据 了 。 本 节 就 来 研究 这 几 个 问题 。 





内 
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7.3.1 重复 释放 
将 同一 块 内 存 释放 两 次 称 为 重复 释放 ，2.3.2 节 中 已 经 解释 过 了 。 下 面 说 明 这 种 问题 
如 何 发 生 : 

char *name = (char*)malloc(...); 

free(name) ; // 第 一 次 释放 

Fre namey ; // 第 二 次 释放 
在 zlib 压缩 库 的 早期 版 本 中 就 可 能 存在 重复 释放 导致 的 拒绝 服务 攻击 或 是 代码 注 
入 。 不 过 这 种 情况 很 少 发 生 ， 而 且 新 版 本 已 经 修复 了 漏洞 。 关 于 这 个 漏洞 的 更 多 信 
息 可 以 查看 cert.org。 
避免 这 类 漏洞 的 简单 办 法 是 释放 指针 后 总 是 将 其 置 为 NULL， 大 部 分 堆 管 理 器 都 会 包 
略 后 续 对 空 指针 的 释放 。 

















char *name = (char*)malloc(...); 


free(name); 
name = NULL; 


在 3.2.7 市 中 ， 我 们 开发 了 一 个 函数 来 实现 这 种 效果 。 


7.3.2 清除 敏感 数据 

一 旦 不 再 需要 内 存 中 的 敏感 数据 ,马上 进行 履 写 是 个 好 主意 。 当 应 用 程序 终止 后 ， 
大 部 分 操作 系统 都 不 会 把 用 到 的 内 存 清 零 或 是 执行 别 的 操作 。 系 统 可 能 会 将 之 前 用 
过 的 空间 分 配给 别 的 程序 ， 那 么 它 就 能 访问 内 存 中 的 内 容 。 禾 写 敏感 数据 后 别 的 应 
用 程序 就 难以 从 之 前 持 有 这 部 分 数据 的 内 存 中 获取 有 用 的 信息 。 下 面 的 代码 会 把 程 
序 中 的 敏感 数据 清空 : 





char name[32]; 
int userID; 
char *securityQuestion; 


// 赋值 
// 删除 敏感 信息 
memset (name,0,sizeof (name)); 


userID = 0; 
memset (securityQuestion,0,strlen(securityQuestion)); 


如 果 声 明 name 为 指针 ， 那 么 我 们 就 应 该 在 释放 内 存 之 前 将 其 清空 ， 如 下 所 示 : 
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char *name = (char*)malloc(...); 


memset (name,0,sizeof (name)); 
free(name); 


有 很 多 静态 分 析 工 具 可 以 检查 指针 的 误 用 ， 此 外 ， 大 部 分 编译 器 都 有 选项 来 监测 本 


章 提 到 的 很 多 问题 。 比 如 说 ，GCC 编译 器 的 -Wall 选项 可 以 启用 编译 器 警告 。 





下 面 说 明 本 章 的 一 些 示 例会 产生 什么 样 的 警告 ， 这 里 我 们 忘记 在 调用 函数 时 写 上 括 


号 了 : 
if(getSystemStatus == 0) { 


结果 会 产生 如 下 警告 : 


warning: the address of 'getSystemStatus' will never be NULL 


下 面 是 一 个 本 质 上 完全 一 样 的 错误 : 


if(getSystemStatus) { 


不 过 » 警告 信 息 会 有 所 不 同 : 


warning: the address of 'getSystemStatus' will always evaluate as 'true' 





使 用 不 兼容 的 指针 类 型 也 会 产生 警告 : 
int (*fptrCompute) (int,int); 
int addNumbers(int nl, int n2, int n3) { 


return nl+n2+n3; 


} 


trEombuie = addNumbers; 
下 面 是 警告 信息 : 
warning: assignment from incompatible pointer type 
没有 初始 化 指针 通常 也 会 出 问题 : 


char *SsecurityQuestion; 
strcpy(securityQuestion,"Name of your home town"); 


产生 的 警告 信息 相当 直 白 : 
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warning: 'securityQuestion' is used uninitialized in this function 


还 有 很 多 静态 分 析 工 具 可 用 ， 有 的 免费 ， 有 的 收费 ， 它 们 一 般 都 会 提供 比 编译 器 更 
强 的 诊断 功能 。 因 为 太 过 复杂 ， 超 出 了 本 书 的 范围 ， 这 里 就 不 再 举例 了 。 





7.5 “小 结 


本 章 研 究 了 指针 如 何 影 响应 用 程序 的 安全 性 和 可 靠 性 。 这 些 问题 都 是 围绕 声明 和 初始 
化 指针 、 使 用 指针 和 释放 内 存 组 织 的 。 比 如 说 ， 在 使 用 指针 之 前 初始 化 很 重要 ， 用 完 
字符 串 之 后 清空 内 存 也 很 重要 。 将 指针 置 为 NULL 是 很 多 情况 下 的 有 效 解决 方法 。 
有 不 少 误 用 指针 的 方法 ， 其 中 多 种 涉及 越过 字符 串 边 界 写 和 内存 ， 它 是 缓冲 区 溢出 
的 一 种 形式 。 误 用 指针 会 导致 很 多 方面 的 未 定义 行为 ， 包 括 指 针 类 型 不 匹配 和 不 正 
确 的 指针 算术 运算 。 

我 们 说 明了 避免 这 类 问题 的 一 些 技术 ， 其 中 一 部 分 只 需要 理解 如 何 使 用 指针 和 字符 
串 就 能 搞定 。 我 们 也 接触 了 如 何 用 编译 器 和 静态 分 析 工具 来 定位 潜在 的 问题 。 
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第 8 和 章 


其 他 重要 内 容 








几乎 在 任何 方面 ， 指 针对 C 都 至 关 重 要 ， 其 中 很 多 我 们 已 经 讲 得 很 清楚 了， 比如 数 
组 和 函数 。 本 章 研究 一 些 不 大 适合 放 进 前 面 章 市 但 很 重要 的 主题 ， 这 些 主题 将 完善 
你 对 指针 工作 原理 的 理解 。 


本 章 将 研究 以 下 儿 个 跟 指针 相关 的 主题 : 


。 指针 的 类 型 转换 ， 

。 访问 硬件 设备 ， 

。 别名 和 强 别名 ， 

。 使 用 restrict 关键 字 ， 
. 线程 ; 

。 面向 对 象 技 术 。 


关于 线程 ， 我 们 对 两 个 方面 感 兴趣 : 一 是 用 指针 在 线程 之 间 共享 数据 这 个 基本 问题 ， 
二 是 如 何 用 指针 支持 回调 函数 。 一 个 操作 可 能 会 调用 某 函 数 来 执行 任务 ， 如 果实 际 
被 调用 的 函数 发 生 了 改变 ,我们 就 称 之 为 回调 函数 。 比 如 第 5 章 用 到 的 sort 函数 
就 是 一 个 回调 函数 。 我 们 可 以 使 用 回调 函数 在 线程 之 间 通 信 。 


本 章 会 讲 到 两 种 在 C 中 支持 面向 对 象 类 型 的 方法 : 第 一 种 是 用 不 透明 指针 ， 这 种 技 
术 对 用 户 隐藏 了 数据 结构 的 实现 细 市 ， 第 二 种 技术 说 明 如 何在 C 中 实现 多 态 类 型 。 
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8.1 转换 指针 


类 型 转换 是 一 种 基本 操作 ， 跟 指针 结合 使 用 时 很 有 用 。 转 换 指 针对 我 们 大 有 帮助 ， 
原因 包括 : 


。 访问 有 特殊 目的 的 地 址 ，; 
。 分 配 一 个 地 址 来 表示 端口 ， 
。 判断 机 器 的 字 节 序 。 


我 们 也 会 处 理 一 个 跟 8.2.1 市 中 的 类 型 转换 紧密 相关 的 主题 。 





机 器 的 字 节 序 一 般 是 指数 据 类 型 内 部 的 字 节 顺序 。 两 种 常见 的 字 节 序 是 小 
” 字 市 序 和 大 字 节 序 。 小 字 市 序 是 指 将 低位 字 市 存储 在 低地 址 中 ， 而 大 字 市 
” 序 是 指 将 高 位 字 节 存储 在 低地 址 中 。 








我 们 可 以 把 整数 转换 成 整数 指针 ， 如 下 所 示 : 

int num = 8; 

int *pi = (int*)num; 
不 过 ， 一般 来 说 这 不 是 好 实践 ， 因 为 它 允 许 你 访问 任意 地 址 ， 包 括 系统 不 允许 程序 
访问 的 位 置 。 图 8-1 说 明了 这 一 点 ， 地 址 8 不 在 应 用 程序 的 地 址 空间 内 ， 如 果 解 引 
指针 ， 一 般 就 会 导致 应 用 程序 终止。 








:< 应 用 程序 的 有 效 
num 1000 | 8 | : 地 址 空间 











图 8-1: 把 整数 转换 成 非法 地 址 


有 些 情 况 下 ， 比 如 我 们 需要 寻 址 内 存 地 址 0， 就 可 能 需要 把 指针 转换 成 整数 ， 然 后 
再 转换 回 指针 ， 这 在 老式 的 系统 上 比较 常见 ， 其 指针 长 度 和 整数 长 度 相同 。 不 过 ， 
有 时候 这 样 不 能 正常 工作 。 下 面 说 明了 这 种 方法 ， 输 出 跟 实现 相关 : 
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pi = Snum， 

printf("Before: %p\n",pi); 
int tmp = (int)pi; 

pi = (int*)tmp; 
printf("After: %p\n",pi); 


把 指针 转换 为 整数 再 转换 回 指针 从 来 就 不 是 什么 好 办 法 ， 如 果 确 实 需要 这 么 做 ， 考 





虚 用 联合 体 ，8.2.1 市 会 讨论 这 个 主题 。 


记 住 在 指针 与 整数 之 间 来 回转 换 和 在 指针 与 void 指针 之 间 来 回转 换 不 同 ，1.1.8 市 


中 的 “void 指针 ”部 分 有 说 明 。 


对 3 








必 ， 源 的 地 址 。 


8.1.1 访问 特殊 用 途 的 地 址 
访问 特殊 用 途 的 地 址 的 需求 一 般 发 生 在 人 能 入 式 系统 上 ， 


有 时 候 容 易 将 多 柄 和 指针 搞 混 。 句 柄 是 系统 资源 的 引用 ， 对 资源 的 访问 通 
、 过 句柄 实现 。 不 过 ， 句 柄 一 般 不 提供 对 资源 的 直接 访问 ， 指 针 则 包含 了 资 

















磐 入 式 系统 对 应 用 程序 的 介 


入 很 少 。 比 如 说 ， 在 有 些 底层 操作 系统 内 核 中 ，PC 的 显存 地 址 是 0xB8000， 这 个 地 
址 装 的 是 字符 模式 下 显示 的 第 一 行 第 一 列 的 字符 ， 我 们 可 以 把 这 个 地 址 赋 给 某 个 指 





针 ， 然 后 把 某 个 字符 赋 给 这 个 地 址 ， 代 码 如 下 所 示 。 图 





#define VIDEO BASE 0xB8000 
int *video = (int *) VIDEO BASE; 
*vyideo = 'A'; 


8-2 显示 了 内 存 布局 。 





10 [| 
video 104 |0xB8000 | 


oxB8000 [A ”| ;< 一 显存 
oxB8004 | . |: 
oxB8008 ;| . |: 
oxB800C :| . | 











图 8-2: 在 PC 上 寻 址 显存 


在 适当 情况 下 ， 可 以 读 取 这 个 地 址 的 内 容 ， 不 过 一 般 不 会 对 显存 地 址 这 么 做 。 
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当 你 需要 寻 址 地 址 0 的 内 存 时 ， 有 时 候 编 译 器 会 把 它 当 做 NULL 指针 值 。 底 层 内 核 
程序 通常 需要 访问 地 址 0， 有 几 种 技术 可 以 处 理 这 种 情况 : 

。 把 指针 置 为 0 (不 一 定 能 工作 ) ; 

。 把 整数 置 为 0， 再 把 这 个 整数 转换 为 指针 ， 

。 用 8.2.1 市 中 提 到 的 联合 体 ，; 

。 用 memset 函数 把 指针 置 为 0。 


下 面 是 一 个 使 用 memset 函数 的 例子 ， 这 里 将 ptr 引用 的 内 存 置 为 0: 

















memset((void*)&ptr, 0, sizeof(ptr)); 


在 需要 寻 址 0 地 址 内 存 的 系统 上 ， 厂 商 一 般 会 有 解决 问题 的 办 法 。 





8.1.2 访问 端口 

端口 既是 硬件 概念 ， 也 是 软件 概念 。 服 务 器 用 软件 端口 指明 它们 要 接收 发 给 这 台 机 
器 的 某 类 消息 。 硬 件 端口 通常 是 一 个 连接 到 外 部 设备 的 物理 输入 输出 系统 组 件 。 程 
序 通 过 读 写 硬件 端口 可 以 处 理 信息 和 命令 。 


访问 端口 的 软件 一 般 是 操作 系统 的 一 部 分 ， 下 面 说 明 如 何 用 指针 访问 端口 : 


#define PORT 0xB0000000 
unsigned int volatile * const port = (unsigned int *) PORT; 


机 器 用 十 六 进 制 地 址 表示 端口 ， 将 数据 作为 无 符号 整数 处 理 。volatile 关键 字 修 
饰 符 表 示 可 以 在 程序 以 外 改变 变量 。 比 如 说 ， 外 部 设备 可 能 会 向 端口 写 人 数据 ， 且 
可 以 独立 于 计算 机 的 处 理 器 执行 这 个 写 操作 。 出 于 优化 目的 ， 编 译 器 有 时候 会 临时 
使 用 缓存 或 是 寄存 器 来 持 有 内 存 中 的 值 ， 如 果 外 部 的 操作 修改 了 这 个 内 存 位 置 ， 改 
动 并 不 能 反映 到 缓存 或 寄存 器 中 。 


用 volatile 关键 字 可 以 阻止 运行 时 系统 使 用 寄存 器 暂 存 端口 值 ， 每 次 访问 端口 都 
需要 系统 读 写 端口 ， 而 不 是 从 寄存 器 中 读 取 一 个 可 能 已 经 过 期 的 值 。 我 们 不 应 该 把 
所 有 变量 都 声明 为 voLatiLe， 因 为 这 样 会 阻碍 编译 器 进行 所 有 类 型 的 优化 。 

之 后 应 用 程序 可 以 通过 解 引 端口 指针 来 读 写 端口 ， 如 下 所 示 。 内 存 布 局 见 图 8-3， 
可 以 通过 0xB0000000 处 的 内 存 读 写 外 部 设备 : 


























*port = 0x0BF4; // 写 人 端口 
value = *port; // 从 端口 读 取 
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0XxB0000000 外 部 设备 
0xB0000004| | 








图 8-3: 访问 端口 





用 非 volatile 变量 访问 volatile 内 存 不 是 个 好 主意 ， 这 么 做 会 导致 未 


一 E> 定义 的 行为 


8.1.3 用 DMA 访 问 内 存 


直接 内 存 访问 (Direct Memory Access，DMA) 是 一 种 辅助 系统 在 内 存 和 某 些 设备 
间 传输 数据 的 底层 操作 ， 它 不 属于 ANSI C 规范 ， 但 是 操作 系统 通常 提供 对 这 种 操 
作 的 支持 。DMA 操作 一 般 与 CPU 并 行进 行 ， 这 样 可 以 将 CPU 解放 出 来 执行 其 他 任 
务 ， 从 而 得 到 更 好 的 性 能 。 

程序 员 先 调 用 DMA 函数 ， 然 后 等 待 操作 完成 。 通 常 ， 程 序 员 会 提供 一 个 回调 函数 ， 
当 操作 完成 后 ， 操 作 系统 会 调用 回调 函数 ， 回 调 函 数 由 函数 指针 指定 ，8.3.2 节 中 会 
深入 讨论 。 

















8.1.4 判断 机 器 的 字 节 序 
我 们 可 以 使 用 类 型 转换 操作 来 判断 架构 的 字 节 序 。 字 节 序 是 指 内 存单 元 中 字 节 的 顺 
序 ， 字 节 序 一 般 分 为 小 字 节 序 和 大 字 节 序 ， 比 如 说 ， 采 用 小 字 节 序 表示 整数 的 4 个 
字 节 中 的 低地 址 用 来 存储 整数 的 低位 。 


在 下 例 中 , 我 们 把 整数 的 地 址 从 指针 转换 为 char， 然 后 打印 各 个 字 市 : 


int num = 0x12345678 ; 
char* pc = (char*) &num; 
for (int i = 0; i < 4; i++) { 
printf("%p: %02x \n", pc, (unsigned char) *pc++); 
} 


这 个 代码 片段 在 Intel PC 上 的 输出 如 下 ， 反 映 了 这 是 小 字 节 序 架 构 。 图 8-4 说 明了 
这 些 值 在 内 存 中 如 何 分 配 。 
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100: 78 
101: 56 
102: 34 
103; .12 





num 


100 101 102 103 








图 8-4: 字 节 序 示 例 


8.2 别名 、 强 别名 和 restrict 关 键 字 


如 果 两 个 指针 引用 同一 内 存 地 址 ， 我 们 称 一 个 指针 是 另 一 个 指针 的 别名 。 别 名 并 不 
罕见 ， 不 过 可 能 会 引发 一 些 问 题 。 下 面 的 代码 声明 了 两 个 指针 ， 并 把 它们 都 指向 同 
一 地 址 : 





int num = 5; 

int* pl = &num; 

int* p2 = &num; 
当 编 译 器 为 指针 生成 代码 时 ， 除 非特 别 指定 ， 它 必须 假设 可 能 会 存在 别名 。 使 用 别 
名 会 对 编译 器 生成 代码 有 所 限制 ， 如 果 两 个 指针 引用 同一 位 置 ， 那 么 任何 一 个 都 可 
能 修改 这 个 位 置 。 当 编译 器 生成 读 写 这 个 位 置 的 代码 时 ， 它 就 不 能 通过 把 值 放 入 寄 
存 器 来 优化 性 能 。 对 于 每 次 引用 ， 它 只 能 执行 机 器 级 别 的 加 载 和 保存 操作 。 频 繁 的 
加 载 /保存 会 很 低 效 ， 在 某 些 情况 下 ， 编 译 器 还 必须 关心 操作 执行 的 顺序 。 


强 别名 是 另 一 种 别名 ， 它 不 允许 一 种 类 型 的 指针 成 为 另 一 种 类 型 的 指针 的 别名 。 下 
面 的 代码 中 ， 一 个 整数 指针 是 一 个 浮 点 数 指针 的 别名 ， 这 破坏 了 强 别名 的 规则 。 这 
段 代 码 判断 一 个 数 是 否 为 负数 ， 相 比 将 它 的 参数 跟 0 比较 来 判断 正 负 ， 这 种 方法 执 
行 速度 更 快 : 








float number = 3.25f; 
unsigned int *ptrValue = (unsigned int *)énumber; 
unsigned int result = (*ptrValue & 0x80000000) == 0; 


过 忆 


强 别名 规则 对 符号 或 修饰 符 不 起 作用 ， 下 面 都 是 合法 的 强 别名 : 


入 int num; 

、 Const int *ptrl = Snum; 
int *ptr2 = &num; 

int volatile ptr3 = &num; 








不 过 ， 有 些 情况 下 ， 对 同样 的 数据 采用 不 同 的 表现 形式 也 是 有 用 的 ， 为 了 避免 别名 
问题 ， 可 以 采用 这 几 种 技术 : 
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。 使 用 联合 体 ， 
。 关闭 强 别 名 ， 
。 使 用 char 指针 。 


两 种 数据 类 型 的 联合 体 可 以 避 开 强 别名 的 问题 ，8.2.1 节 中 会 讨论 这 个 主题 。 如 果 编 
译 器 有 禁用 强 别名 的 选项 ， 就 可 以 关闭 它 。GCC 编译 器 有 如 下 的 编译 器 选项 : 





。 -fno-strict-aliasing 可 以 关闭 强 别名 ， 
。 -fstrict-aliasing 可 以 打开 强 别名 ， 
。 -Wstrict-aliasing 可 以 打开 跟 强 别名 相关 的 警告 信息 。 


需要 关闭 强 别名 的 代码 可 能 意味 着 差劲 的 内 存 访 癌 实践 ， 如 果 可 能 的 话 ， 花 些 时 间 
解决 这 些 问题 ， 而 不 是 关闭 强 别名 。 





注 羽 
1 





编译 器 并 非 总 能 准确 地 报告 别名 相关 的 警告 ， 有 时 候 会 漏 报 ， 有 时 候 会 虚 
` 4 ， 报 ， 最 终 还 是 要 靠 程序 员 定 位 别名 问题 。 


\ 
半 





0, 

编译 器 总 是 假定 char 指针 是 任意 对 象 的 潜在 别名 ， 所 以 ， 大 部 分 情况 下 可 以 安全 
地 使 用 。 不 过 ， 把 其 他 数据 类 型 的 指针 转换 成 char 指针 ， 再 把 char 指针 转换 成 其 
他 数据 类 型 的 指针 ， 则 会 导致 未 定义 的 行为 ， 应 该 避免 这 么 做 。 


8.2.1 用 联合 体 以 多 种 方式 表示 值 

C 是 类 型 语言 ， 在 声明 变量 时 就 得 为 其 指定 类 型 。 可 以 存在 不 同类 型 的 多 个 变量 ， 
有 时 候 ， 可 能 需要 把 一 种 类 型 转换 成 另 一 种 类 型 ， 这 一 般 是 通过 类 型 转换 实现 的 ， 
不 过 也 可 以 使 用 联合 体 。 类 型 双关 就 是 指 这 种 绕 开 类 型 系统 的 技术 。 

如 果 转 换 涉及 指针 ， 可 能 会 产生 严重 问题 。 为 了 说 明 这 种 技术 ,我们 会 用 到 三 个 不 
同 的 函数 ， 这 些 函数 会 判断 一 个 学 点 数 是 否 为 正 。 

第 一 个 函数 用 了 浮 点 数 和 无 符号 整数 的 联合 体 ， 如 下 所 示 ， 函 数 先 把 浮 点 数 赋 给 联 
合体 ， 然 后 再 获取 整数 来 执行 测试 








上 





typedef union conversion { 
float fNum; 
unsigned int uiNum; 

} Conversion; 


int isPositivel(float number) { 
Conversion conversion = { .fNum =number}; 
return (conversion.uiNum & 0x80000000) == 0; 
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这 样 可 以 正确 工作 ， 也 不 会 涉及 别名 ， 因 为 没有 用 到 指针 。 下 面 这 个 版 本 用 了 两 种 
数据 类 型 的 指针 的 联合 体 ， 将 浮 点 数 的 地 址 赋 给 第 一 个 指针 ， 然 后 解 引 整数 指针 来 
执行 测试 。 这 样 破坏 了 强 别名 规则 : 








typedef union conversion2 { 
float *fNum; 
unsigned int *uiNum; 

} Conversion2; 


int isPositive2(float number) { 
Conversion2 conversion; 
conversion.fNum =&number; 
return (*conversion.uiNum & Ox80000000) == 0; 


} 


下 面 这 个 函数 没有 用 联合 体 ， 而 且 破 坏 了 强 别名 规则 ， 因 为 ptrValue 指针 和 number 
共享 了 同一 个 地 址 : 





int isPositive3(float number) { 
unsigned int *ptrValue = (unsigned int *)&number; 
return (*ptrValue & 0x80000000) == 0; 

} 


这 三 个 函数 所 用 的 方法 做 了 如 下 假设 : 


。 表示 浮 点 数 用 的 是 IEEE-754 浮 点 数 标 准 ， 
。 以 特定 方式 布局 浮 点 数 ， 
。 正确 对 齐 了 整数 和 浮 点 数 指针 。 


不 过 ， 这 些 假设 不 一 定 有 效 。 类 似 方法 可 以 优化 性 能 ， 但 不 一 定 可 移植 。 如 果 移 植 
性 变 得 重要 ， 执 行 浮 点 数 比较 是 更 好 的 办 法 。 


8.2.2” 强 别名 

编译 器 不 会 强制 使 用 强 别名 ， 它 只 会 产生 警告 。 编 译 器 假设 两 个 或 更 多 不 同类 型 的 
指针 永远 不 会 引用 同一 个 对 象 ， 这 也 包括 除名 字 外 其 他 都 相同 的 结构 体 的 指针 。 有 
了 强 别 名 ， 编 译 器 可 以 做 某 些 类 型 的 优化 。 如 果 这 个 假设 不 正确 ， 就 会 产生 不 可 预 
期 的 结果 。 


即使 两 个 结构 体 的 字段 完全 一 样 ， 但 如 果 名 字 不 同 的 话 ， 这 两 种 结构 体 的 指针 就 不 
应 该 引用 同一 对 象 。 在 下 面 的 例子 中 ， 我 们 假设 person 和 employee 指针 永远 不 
会 引用 同一 对 象 : 








typedef struct person { 
char* firstName; 
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char* lastName; 
unsigned int age; 
} Person; 


typedef struct employee { 
char* firstName; 
char* lastName; 
unsigned int age; 

} Employee; 


Person* person; 
Employee* employee; 


不 过 ， 如 果 定 义 了 同一 个 结构 体 的 两 个 类 型 ， 那 么 指向 不 同名 字 的 指针 可 以 引用 同 
一 对 象 : 
typedef struct person { 
char* firstName; 
char* lastName; 


unsigned int age; 
} Person; 


typedef Person Employee; 


Person* person; 
Employee* employee; 


8.2.3 使 用 restrict 关 键 字 

C 编译 器 默认 假设 指针 有 别名 ， 用 restrict 关键 字 可 以 在 声明 指针 时 告诉 编译 器 
这 个 指针 没有 别名 ， 这 样 就 允许 编译 器 产生 更 高 效 的 代码 。 很 多 情况 下 这 是 通过 组 
存 指针 实现 的 ， 不 过 要 记 住 这 只 是 个 建议 ， 编 译 器 也 可 以 选择 不 优化 代码 。 如 果 用 
了 别名 ， 那 么 执行 代码 会 导致 未 定义 行为 ， 编 译 器 不 会 因为 破坏 强 别 名 假设 而 提供 
任何 警告 信息 。 


过 3 











新 开发 的 代码 应 该 尽量 对 指针 声明 使 用 restrict 关键 字 ， 这 样 会 产生 更 
。 高 效 的 代码 ， 而 修改 已 有 代码 可 能 就 不 划算 了 。 





下 面 这 个 函数 说 明 restrict 关键 字 的 定义 和 使 用 ， 该 函数 把 两 个 向 量 相 加 ， 并 将 
结果 存在 第 一 个 向 量 中 : 


void add(int size, double * restrict arrl, const double * restrict arr2) { 
for (int i = 0; i < size; i++) { 
arrl[i] += arr2[i]; 


} 
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两 个 指针 参数 都 用 了 restrict 关键 字 ， 但 是 它们 不 应 该 引用 同一 块 内 存 ， 下 面 是 
国 数 的 正确 用 法 : 


double vectorl[] 
double vector2[] 


add(4,vector]l,vector2); 


在 下 面 的 代码 中 ， 两 个 参数 用 了 同一 个 向 量 ， 这 样 的 调用 是 不 正确 的 。 第 一 个 调用 
语句 用 了 别名 ， 而 第 二 个 调用 语句 则 使 用 了 同一 个 向 量 两 次 : 








double vectorl[] = {1.1, 2.2, 3.3, 4.4}; 
double *vector3 = vectorl; 


add(4,Vvectorl,Vvector3) ; 
add(4,vector]l,vector]l); 


尽管 这 么 做 有 时 候 能 正确 工作 ， 但 是 调用 函数 的 结果 是 不 可 靠 的 。 
一 些 标准 C 函数 用 了 restrict 关键 字 ， 包 括 : 


void *memcpy (void * restrict sl, const void * restrict s2, size t n); 

。 char *strcpy(char * restrict sl, const char * restrict s2); 

。 Char *strncpy(char * restrict sl, const char * restrict s2, size t+ n); 

。 int printf(const char * restrict format, ... ); 

。 int sprintf(char * restrict s, const char * restrict format, ... ); 

。 int snprintf(char * restrict s, size t n, const char * restrict format, 
人 

。 int scanf(const char * restrict format, ...); 


restrict 关键 字 隐 含 了 两 层 含义 : 


(1) 对 于 编译 器 来 说 ， 这 意味 着 它 可 以 执行 某 些 代码 优化 ; 
(2) 对 于 程序 员 来 说 ， 这 意味 着 这 些 指针 不 能 有 别名 ， 否 则 操作 的 结果 将 是 未 定义 的 。 


8.3 线程 和 指针 

线程 之 间 共 享 数据 会 引发 一 些 问题 。 常 见 的 问题 是 数据 损坏 。 线 程 可 以 写 入 对 象 ， 
但 可 能 时 不 时 地 被 挂 起 ， 导 致 对 象 处 于 不 一 致 的 状态 。 之 后 另 一 个 线程 可 能 会 在 第 
一 个 线程 继续 写 入 之 前 读 取 对 象 ， 那 么 第 二 个 线程 就 会 使 用 无 效 的 或 损坏 的 数据 。 


指针 是 在 另 一 个 线程 中 引用 数据 的 常见 方式 ， 我 们 会 研究 对 多 线程 应 用 程序 造成 不 
利 影 响 的 一 些 问 题 。 正 如 我 们 将 在 本 节 的 例子 中 看 到 的 那样 ， 很 多 时 候 会 用 互 斥 锁 
































保护 数据 。 

Cl11 标准 实现 了 线程 ， 但 是 目前 还 没有 得 到 广泛 支持 。 有 很 多 库 可 以 让 C 支持 线 
程 ， 我 们 会 用 POSIX 线程 ， 因 为 这 个 库 已 经 可 用 。 不 管用 什么 库 ， 这 里 展示 的 技术 
都 适用 。 


我 们 用 指针 支持 多 线程 程序 和 回调 国 数 。 这 里 涉及 线程 这 个 主题 ， 本 章 假 设 你 熟 
悉 基 本 的 线程 概念 和 术语 ， 所 以 ， 我 们 不 会 深入 讨论 POSIX 线程 函数 的 工作 原理 。 
读者 可 以 查看 O'Reilly 的 Pthreads Programming (http://shop.oreilly.com/product/ 
9781565921153.do) 获取 关于 这 个 主题 的 详细 讨论 。 


8.3.1 ”线程 间 共 享 指针 
两 个 或 更 多 线程 共享 数据 可 能 损坏 数据 。 为 了 说 明 这 个 问题 ， 我 们 会 实现 一 个 计算 
两 个 向 量 点 积 的 多 线程 函数 。 多 个 线程 会 同时 访问 两 个 向 量 和 一 个 和 字段 。 当 线程 
完成 后 ， 和 字段 会 持 有 点 积 的 值 。 


两 个 向 量 的 点 积 通过 把 每 个 向 量 对 应 的 元 素 相 乘 后 得 到 的 积 再 相 加 来 计算 。 我 们 会 
用 到 两 个 数据 结构 支持 这 个 操作 。 第 一 个 是 VectorInfo， 包 含 关于 被 操作 向 量 的 
信息 ， 它 有 两 个 向 量 的 指针 、sum 字段 〈 持 有 点 积 ) ， 以 及 Length 字段 (指定 点 积 
国 数 要 用 的 向 量 段 的 长 度 )。tLength 字段 表示 线程 处 理 的 向 量 的 部 分 ， 不 是 整个 向 
量 的 长 度 : 

















typedef struct { 
double *vectorA; 
double *vectorB; 
double sum; 
int length; 

} VectorInfo; 


第 二 个 数据 结构 是 Product， 包 含 一 个 VectorInfo 指针 和 计算 点 积 向 量 的 起 始 索 
引 。 我 们 会 用 不 同 的 起 始 索 引 为 每 个 线程 创建 这 个 结构 体 的 实例 : 
typedef struct { 
VectorInfo *info; 
int beginningIndex; 
} Product; 
所 有 线程 会 在 同一 时 间 对 两 个 向 量 进行 计算 ， 但 是 它们 访问 的 是 向 量 的 不 同 部 分 ， 
所 以 不 会 有 冲突 。 每 个 线程 会 计算 自己 负责 的 那些 向 量 的 和 。 不 过 ， 这 个 和 需要 累 
加 到 VectorInfo 结构 体 的 sum 字段 上 。 多 个 线程 可 能 会 同时 访问 sum 字段 ， 所 以 
需要 用 互 斤 锁 保护 数据 ， 下 面 会 声明 互 斥 锁 。 同 一 时 间 互 斥 锁 只 允许 一 个 线程 访问 
受 保护 的 变量 。 下 面 声 明 的 互 斥 锁 保 护 sum 变量 ， 我 们 在 全 局 区 域 声 明 它 以 允许 多 
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个 线程 访问 : 


pthread mutex t mutexSum; 


后 面 会 列 出 dotProduct 函数 ， 创 建 线 程 时 会 
， 参 数 为 一 个 void 指针 。 
结构 体 实 例 。 


数 内 部 ， 我 们 声明 了 变量 来 持 有 起 始 索 引 和 结束 索引 。 
变量 中 保存 累积 的 总 和 。 国 数 的 最 后 部 分 会 锁 住 互 斥 锁 ， 把 total 








要 声明 这 个 函数 的 返回 值 为 空 
信息 ， 这 里 传递 的 是 一 个 Product 
在 函 

法 ， 并 在 total ” 





加 到 sum 上 ， 然 后 解 开 互 斥 锁 。 锁 信 


OD 所 以 需 
这 个 指针 可 以 给 函数 传递 


for 循环 执行 实际 的 乘 





FE 互 斥 锁 后 ， 其 他 线程 无 法 访问 sum 变量 : 





void dotProduct(void *prod) { 
Product *product 


(Product*)prod; 


VectorInfo *vectorInfo = Product->info; 


int beginningIndex 
int endingIndex = 
double total = 


for (int i = beginningIndex; 


total += (vectorInfo->vectorA[il] 


} 


Product- 
beginningIndex + vectorInfo->length; 


>beginningIndex; 


i < endingIndex; i++) { 
* vectorInfo->vectorB[i]); 


pthread mutex lock(&mutexSum); 


vectorInfo->sum += total; 


pthread mutex unlock(&mutexSum); 


pthread exit((void*) 0); 
} 


创建 线程 的 代码 如 下 所 示 。 我 们 声 
例 
#define NUM_ THREADS 4 


void threadExample() { 
VectorInfo vectorInfo; 


明了 两 个 简单 向 量 ， 还 有 一 个 VectorInfo 实 


每 个 向 量 有 16 个 元 素 ，Length 字段 设置 为 4: 


double vectorA[] = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 
9.0; 1102071307 12:0) 13.07..14.0%"15.0;. 16350}; 

double vectorB[] = {1.0, 2.0, 3.0, 4.0, 5.0, 6.0, 7.0, 8.0, 
9.0, 10.0, 11.0, 12.0, 13.0, 14.0, 15.0, 16.0}; 

double sum; 

vectorInfo.vectorA = vectorA; 

vectorInfo.vectorB = vectorB; 


vectorInfo.length = 


下 面 创建 了 一 个 4 个 元 素 的 线程 数组 ， 


还 有 初始 化 互 斥 锁 和 线程 的 属性 字段 的 代码 : 





pthread t threads[NUM THREADS] ， 


void *status; 
pthread attr t attr; 


pthread mutex init(&mutexSum, NULL); 
pthread attr init(&attr); 
pthread attr setdetachstate(&attr, PTHREAD CREATE JOINABLE); 


int returnValue; 
int threadNumber; 


每 次 迭代 都 会 创建 一 个 新 的 Product 实例 ， 我 们 会 把 vectorInfo 的 地 址 和 一 个 基 





于 threadNumber 得 到 的 唯一 索引 赋 给 它 ， 然 后 创建 线程 : 


for (threadNumber = 0; threadNumber < NUM THREADS; threadNumber++) { 


Product *product = (Product*) malloc(sizeof (Product)); 
product->beginningIndex = threadNumber * 4; 
product->info = &vectorInfo; 
returnValue = pthread create(&threads[threadNumber], &attr, 
dotProduct, (void *) (void*) (product)); 
if (returnValue) { 
printf("ERROR; Unable to create thread: %d\n", returnValue) 
exit(-1); 


} 


Loop 循环 结束 后 ， 销 毁 线 程 属 性 和 互 斥 锁 ，for 循环 确保 程序 等 到 4 
后 打印 点 积 。 对 于 上 面 的 向 量 ， 得 到 的 是 1496 





pthread attr destroy(&attr); 


for (int i = 0; i < NUM THREADS; i++) { 
pthread join(threads[i], &status); 
} 


pthread mutex destroy(&mutexSum); 


printf("Dot Product sum: %lf\n", vectorInfo.sum); 
pthread exit (NULL); 


} 


这 样 就 可 以 保护 sum 字段 。 


8.3.2 用 函数 指针 支持 回调 

前 面 我 们 在 第 5 章 中 开发 的 sort 函数 用 到 了 回调 函数 。 因 为 排序 示 
线程 ， 有 些 程 序 员 认为 这 不 是 回调 函数 。 大 家 普遍 认可 的 定义 是 如 果 
件 导 致 另 一 个 线程 的 函数 调用 ， 就 称 为 回调 。 将 回调 函数 的 指针 传递 
数 的 某 个 事件 会 引发 对 回调 函数 的 调用 ， 这 种 方法 在 GUI 应 用 程序 中 
























































了 


个 线程 都 完成 


例 没 有 用 到 多 
一 个 线程 的 事 
给 线程 ， 而 函 
处 理 用 户 线程 
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事件 很 有 用 。 


我 们 会 用 一 个 计算 阶乘 的 国 数 说 明 这 种 方法 ， 这 个 函数 会 在 计算 完 阶乘 后 


回调 第 二 





个 函数 。 关 于 阶乘 的 信息 封装 在 FactorialData 结构 体 中 ， 并 在 两 个 国 数 之 间 传 
递 。 这 个 结构 体 和 阶乘 函数 如 下 所 示 ， 数 据 包括 阶乘 数 、 结 果 和 回调 用 的 函数 指针 。 
factorial 函数 用 这 些 数据 计算 阶乘 ， 把 结果 保存 到 result 字段 ， 调 用 回调 函 
































数 ， 然 后 结束 线程 : 


typedef struct factorialData { 

int number; 

int result; 

void (*callBack)(struct factorialData*); 
} FactorialData; 


void factorial (void *args) { 
FactorialData *factorialData = (FactorialData*) args; 
void (*callBack) (FactorialData*); // 函数 原型 


int number = factorialData->number; 
callBack = factorialData->callBack; 


int num = 1; 
for(int i = 1; i<=number; i++) { 
num *= 1i; 


} 


factorialData->result = num; 
callBack(factorialData); 


pthread exit (NULL); 
3 


我 们 在 startThread 国 数 中 创建 一 个 线程 ， 如 下 所 示 。 这 个 线程 会 执行 





factorial 函数 ， 给 它 传递 阶乘 数据 : 


void startThread(FactorialData *data) { 
pthread t thread id; 


int thread = pthread create(&thread id, NULL, factorial, (void *) data); 


} 
回调 函数 只 是 简单 地 打印 阶乘 结果 : 
void callBackFunction(FactorialData *factorialData) { 


printf("Factorial is %d\n", factorialData->result); 


} 


初始 化 阶乘 数据 和 调用 startThread 函数 的 代码 如 下 所 示 。Sleep 函数 为 所 有 线 


程 正常 结束 提供 足够 的 时 间 : 





FactorialData *data = 
(FactorialData*) malloc(sizeof(FactorialData)); 


if(!data) { 
printf("Failed to allocate memory\n"); 
return; 

} 


data->number = 5; 
data->callBack = callBackFunction; 


startThread (data); 
Sleep(2000); 





执行 代码 后 输出 如 下 : 


Factorial is 120 





程序 也 可 以 执行 其 他 任务 而 不 休眠 ， 它 无 需 等 待 线程 完成 。 


8.4 面 回 对 象 技术 


C 不 支持 面向 对 象 编 程 ， 不 过 ， 借 助 不 透明 指针 ， 我 们 也 可 以 使 用 C 封装 数据 以 及 
支持 某 种 程度 的 多 态 行为 。 我 们 可 以 隐藏 数据 结构 的 实现 和 支持 国 数 ， 用 户 没 有 必 
要 知道 数据 结构 的 实现 细 市 ， 减 少 这 些 实现 细 市 就 可 以 降低 应 用 程序 的 复杂 度 。 此 
外 ， 这 样 也 不 会 引诱 用 户 使 用 数据 结构 的 内 部 细 市 ， 如 果 用 户 使 用 了 ， 之 后 数据 结 
构 的 实现 发 生变 化 后 会 导致 问题 。 


多 态 行为 可 以 帮助 提高 应 用 程序 的 可 维护 性 。 多 态 国 数 的 行为 取决 于 它 执 行 的 目标 
对 象 ， 这 意味 着 我 们 可 以 更 容易 地 为 应 用 程序 添加 功能 。 








8.4.1 创建 和 使 用 不 透明 指针 

不 透明 指针 用 来 在 C 中 实现 数据 封装 。 一 种 方法 是 在 头 文件 中 声明 不 包含 任何 实现 
细节 的 结构 体 ， 然 后 在 实现 文件 中 定义 与 数据 结构 的 特定 实现 配合 使 用 的 函数 。 数 
据 结 构 的 用 户 可 以 看 到 声明 和 函数 原型 ， 但 是 实现 会 被 隐藏 (在 .c/.obj 文件 中 )。 


只 有 使 用 数据 结构 所 需 的 信息 会 对 用 户 可 见 ， 如 果 太 多 的 内 部 信息 可 见 ， 用 户 可 能 会 
使 用 这 些 信 息 ， 从 而 产生 依赖 。 一 旦 内 部 结构 发 生变 化 ， 用 户 的 代码 可 能 就 会 失效 。 
我 们 会 开发 一 个 链表 来 说 明 不 透明 指针 的 用 法 。 用 户 会 用 一 个 函数 来 获取 链表 指针 ， 
然后 用 这 个 指针 来 向 链表 添加 信息 以 及 从 链表 删除 信息 。 链 表 的 内 部 结构 细节 和 支 
持 函 数 对 用 户 不 可 见 。 这 个 结构 的 唯一 可 见 部 分 通过 头 文 件 提供 ， 如 下 所 示 : 
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//Link.h 


typedef void *Data 
typedef struct linkedList LinkedList; 


LinkedList* getLinkedListInstance(); 


void removeLinkedListInstance(LinkedList* list); 


void addNode(LinkedList*, Data); 
Data removeNode(LinkedList*); 


Data 声明 为 void 指针 ， 这 样 允许 实现 处 型 





任何 类 型 的 数据 。LinkedList 的 类 型 








定义 用 了 名 为 LinkedList 的 结构 体 ， 这 个 结构 体 的 定义 在 实现 文件 中 ， 对 用 户 


隐藏 。 





我 们 提供 了 四 种 方法 来 使 用 链表 。 用 户 一 开始 用 getLinkedListInstance 函数 来 获取 
一 个 LinkedList 实例 ， 一 旦 不 再 需要 链表 就 应 该 调用 removeLinkedListInstance 
函数 。 通 过 传递 链表 指针 可 以 让 函数 处 理 一 个 或 多 个 链表 。 


要 将 数据 添加 到 链表 ， 需 要 用 addNode 函数 ， 我 们 给 它 传 递 链 表 和 要 添加 到 链表 的 
数据 指针 。removeNode 方法 会 返回 链表 头 部 的 数据 。 





链表 的 实现 在 名 为 link.c 的 独立 文件 中 。 实 


现 的 第 一 部 分 ， 如 下 所 示 ， 声 明 持 有 用 


户 数据 和 下 一 个 链表 节点 的 结构 体 ， 接 着 是 _LinkedList 结构 体 的 定义 。 在 这 个 


简单 的 链表 中 ， 我 们 只 用 到 了 一 个 头 指 针 ; 
// Link.c 


#include <stdlib.h> 
#include "link.h" 


typedef struct node { 
Data* data; 
struct node* next; 
} Node; 


struct linkedList { 
Node* head; 
}; 





实现 文件 的 第 二 部 分 包含 链表 的 四 个 支持 函数 的 实现 ， 第 一 个 函数 返回 一 个 链表 


实例 : 


LinkedList* getLinkedListInstance() { 


LinkedList* list = (LinkedList*)malloc(sizeof(LinkedList)); 


list->head = NULL; 
return list; 





接着 是 removeLinkedListInstance 国 数 的 实现 ， 如 果 有 节点 的 话 ， 它 
表 中 的 所 有 节点 ， 然 后 释放 链表 本 身 。 如 果 节 点 引用 的 数据 包含 指针 ， 这 
能 会 产生 内 存 漆 漏 。 一 种 解决 方案 是 传递 一 个 释放 数据 成 员 的 函数 : 


会 释放 链 
个 实现 可 





void removeLinkedListInstance(LinkedList* List) { 
Node *tmp = list->head; 
while(tmp != NULL) { 
free(tmp->data); // 潜在 的 内 存 泄漏 ! 
Node *current = tmp; 
tmp = tmp->next; 
free(current); 
} 
free(list); 
} 


addNode 函数 把 第 二 个 参数 传 入 的 数据 添加 到 第 一 个 参数 指定 的 链表 中 。 系 统 会 为 


每 个 节点 分 配 内 存 ， 然 后 将 其 和 用 户 的 数据 关联 起 来 。 在 这 个 实现 中 ， 总 是 将 链表 
的 节点 添加 到 头 部 : 





void addNode(LinkedList* list, Data data) { 
Node *node = (Node*)malloc(sizeof(Node)); 
node->data = data; 
if(list->head == NULL) { 
list->head = node; 
node->next = NULL; 


} else { 
node->next = list->head; 
list->head = node; 

} 


} 


removeNode 函数 返回 跟 链表 中 第 一 个 节点 关联 的 数据 。 我 们 会 调整 头 指 针 ， 让 其 
指向 链表 中 下 个 节点 。 接 着 返回 数据 ， 释 放 旧 节点 ， 将 数据 返回 堆 中 。 


寺 as， 


用 户 使 用 这 种 方法 无 需 记 住 释放 链表 节点 ， 从 而 避免 了 内 存 泄漏 。 这 是 隐 
。 藏 实现 细节 的 巨大 优势 ， 


4 
人 | 

















Data removeNode(LinkedList* List) { 
if(List->head == NULL) { 
return NULL; 
} else { 
Node* tmp = list->head; 
Data* data; 
list->head = list->head->next; 
data = tmp->data; 
free(tmp); 
return data; 





其 他 重要 内 容 | 181 


为 了 说 明 这 个 数据 结构 的 使 用 方法 ， 我 们 会 重用 6.1 节 中 开发 的 Person 结 
构 体 及 甚 国 数 。 下 面 的 代码 会 把 两 个 人 添加 到 链表 中 ， 然 后 删除 。 首 先 调用 
getLinkedListInstance 国 数 来 获取 链表 。 接 着 ， 用 initializePerson 函数 创 
建 一 个 Person 实例 并 用 addNode 国 数 将 其 添加 到 链表 中 。dispLayPerson 函数 
会 打印 由 removeNode 函数 返回 的 人 。 最 后 释放 链表 ; 














#include "link.h"; 
LinkedList* List = getLinkedListInstance(); 


Person *person = (Person*) malloc(sizeof(Person)); 
initializePerson(person, "Peter", "Underwood", "Manager", 36); 
addNode(list, person); 

person = (Person*) malloc(sizeof(Person)); 
initializePerson(person, "Sue", "Stevenson", "Developer", 28); 
addNode(list, person); 


person = removeNode(list); 
displayPerson(*person); 


person = removeNode(list); 
displayPerson(*person); 


removeLinkedListInstance(list); 
这 种 方法 有 几 个 有 趣 的 地 方 。 我 们 只 能 在 link.c 文件 中 创建 LinkedList 结构 体 
的 实例 ， 这 是 因为 如 果 没 有 完整 的 结构 体 声明 就 无 法 使 用 sizeof 操作 符 。 比 如 说 ， 
如 果 你 试图 在 main 函数 中 为 这 个 结构 体 分 配 内 存 ， 如 下 所 示 ， 会 得 到 一 个 语法 错误 : 
LinkedList* list = (LinkedList*)malloc(sizeof(LinkedList)); 
产生 的 语法 错误 类 似 下 面 这 样 : 
error: invalid application of 'sizeof' to incomplete type 'LinkedList' 
类 型 不 完整 是 因为 编译 器 看 不 到 link.c 文件 中 的 实际 定义 。 它 只 能 看 到 LinkedList 
结构 体 的 类 型 定义 ， 而 看 不 到 结构 体 的 实现 细 市 。 
我 们 不 允许 用 户 看 到 链表 内 部 结构 以 及 使 用 链表 内 部 结构 ， 并 且 会 对 用 户 隐藏 结 构 
体 的 任何 变化 。 


只 有 四 个 支持 函数 的 签名 对 用 户 是 可 见 的 ， 否 则 ， 用 户 就 无 法 利用 或 修改 实现 细 市 。 
我 们 封装 了 链表 结构 及 其 支持 函数 ， 从 而 减轻 了 用 户 的 负担 。 


8.4.2 C 中 的 多 态 
C++ 这 类 面向 对 象 语言 的 多 态 是 建立 在 基 类 及 派生 类 之 间 继 承 关 系 的 基础 上 的 。C 
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不 支持 继承 ， 所 以 我 们 得 模拟 结构 体 之 间 的 继承 。 我 们 会 定义 和 使 用 两 个 结构 体 
来 说 明 多 态 行 为 。Shape 结构 体 表示 基 “ 类 ”， 而 Rectangle 结构 体 表 示 从 基 类 
Shape 派生 的 类 。 


结构 体 的 变量 分 配 顺序 对 这 种 技术 的 工作 原理 影响 很 大 。 当 我 们 创建 一 个 派生 类 / 
结构 体 的 实例 时 ， 会 先 分 配 基 类 / 结构 体 的 变量 ， 然 后 分 配 派生 类 / 结构 体 的 变量 。 
我 们 也 需要 考虑 打算 覆盖 的 函数 。 


理解 从 类 实例 化 来 的 对 象 如 何 分 配 内 存 是 理解 面向 对 象 语言 中 继承 和 多 态 
心 。 工 作 原 理 的 关键 。 我 们 在 C 中 使 用 这 种 技术 时 ， 这 一 点 仍然 适用 。 


0, 








让 我 们 先 从 Shape 结构 体 的 定义 开始 ， 如 下 所 示 。 首 先 ， 我 们 分 配 一 个 结构 体 来 为 
Shape 结构 体 持 有 函数 指针 ， 接 着 是 表示 x 和 y 坐标 的 整数 : 


typedef struct shape { 
vFunctions functions; 
// 基 类 变量 
int x; 
int y; 

} Shape; 





我 们 将 vFunctions 结构 体 及 其 支持 函数 声明 定义 如 下 。 当 对 一 个 类 /结构 体 执行 
国 数 时 ， 其 行为 取决 于 它 所 作用 的 对 象 是 什么 。 比 如 说 ， 对 Shape 调用 打印 函数 就 
会 显示 一 个 Shape， 对 Rectangle 调用 打印 函数 就 会 显示 Rectangle。 在 面向 对 
象 编程 语言 中 这 通常 是 通过 虚 表 (或 者 VTable) 实现 的 。vFunctions 结构 体 就 是 
用 来 实现 这 种 功能 的 : 




















typedef void (*fptrSet) (void*,int); 
typedef int (*fptrGet)(void*),; 
typedef void (*fptrDisplay)(); 


typedef struct functions { 
// 函数 
fptrSet SetX; 
fptrGet getX; 
fptrSet sety; 
fptrGet getyY; 
fptrDisplay display; 

} vFunctions; 


这 个 结构 体 由 一 系列 函数 指针 组 成 。fptrSet 和 fptrGet 函数 指针 为 整数 类 型 数 
据 定义 了 典型 的 getter 和 setter 国 数 。 在 这 种 情况 下 ， 它 们 用 来 获取 和 设置 
Shape 或 Rectangle 的 x 和 y 值 。fptrDisplay 国 数 指针 定义 了 一 个 参数 为 空 、 
返回 值 为 空 的 函数 ， 我 们 会 用 这 个 打印 函数 解释 多 态 行为 。 
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Shape 结构 体 有 四 个 函数 跟 它 协同 工作 ， 如 下 所 示 。 它 们 的 实现 很 直观 。 为 了 让 
示例 简单 ， 在 display 国 数 中 ， 我 们 只 是 打印 出 了 字符 串 "Shape"， 我 们 会 把 
Shape 实例 作为 第 一 个 参数 传递 给 这 些 函 数 ， 这 样 可 以 让 这 些 函 数 处 理 多 个 Shape 
实例 : 





void shapeDisplay(Shape *shape) { printf("Shape\n");} 
void shapeSetX(Shape *shape, int x) {shape->x = x;} 
void shapeSetY(Shape *shape, int y) {shape->y = y;} 
int shapeGetX(Shape *shape) { return shape->x;} 

int shapeGetY(Shape *shape) { return shape->y;} 


为 了 辅助 创建 Shape 实例 ， 我 们 提供 了 getShapeInstance 函数 ， 它 为 对 象 分 配 
内 存 ， 然 后 为 其 设置 函数 : 





Shape* getShapeInstance() { 
Shape *shape = (Shape*)malloc(sizeof(Shape)); 
shape->functions.display = shapeDisplay; 


shape->functions.setX = Shape9SetX; 
Shape->functions .getX = ShapeGetX; 
Shape->functions .setY = Shape9SetY; 
shape->functions.getY = ShapeGetY ; 


shape->x = 100; 
shape->y = 100; 
return shape; 


} 
下 面 的 代码 说 明了 这 些 函 数 的 使 用 方法 : 


Shape *sptr = getShapeInstance(); 
sptr->functions.setX(sptr,35); 
sptr->functions.display(); 

printf("%d\n", sptr->functions.getX(sptr)); 


输出 如 下 : 
Shape 
35 


看 起 来 为 了 实现 Shape 结构 体 这 么 做 有 点 大 费 周章 ， 但 是 一 旦 我 们 从 Shape 派生 
出 一 个 Rectangle 结构 体 ， 就 会 看 到 这 么 做 的 强大 能 力 。 这 个 结构 体 如 下 所 示 : 
typedef struct rectangle { 
Shape base; 
int width; 


int height; 
} Rectangle; 


Rectangle 第 一 个 字段 的 内 存 分 配 和 Shape 结构 体 一 样 ， 如 图 8-5 所 示 。 此 外 ,我 
们 还 加 入 了 两 个 新 字段 width 和 height， 来 表示 长 方形 的 属性 。 
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Shape Rectangle 


vFunctions base | vFunctions 


setX 
SetY 
getX 
getY 
display 


SetX 
SetY 
getX 
getY 


display 














8-5: Shape 和 Rectangte 的 内 存 分 配 





跟 Shape 类 似 ，Rectangle 需要 关联 一 些 函 数 ， 声 明和 如下。 除了 用 的 是 Rectangle 
的 base 字段 ， 它 们 跟 Shape 结构 体 关联 的 函数 一 样 。 


void rectangleSetX(Rectangle *rectangle, int x) { 
rectangle->base.x = x; 


} 


void rectangleSetY(Rectangle *rectangle, int y) { 
rectangle->base.y; 


int rectangleGetX(Rectangle *rectangle) { 
return rectangle->base.x; 


int rectangleGetY(Rectangle *rectangle) { 
return rectangle->base.y; 


void rectangleDisplay() { 
printf("Rectangle\n"); 
} 





getRectangleInstance 函数 返回 一 个 Rectangle 结构 体 的 实例 ， 如 下 所 示 : 


Rectangle* getRectangLeInstance() { 
Rectangle *rectangle = (Rectangle*)malloc(sizeof(Rectangle)); 
rectangle->base.functions.display = rectangleDisplay; 
rectangle->base.functions.setX = rectangleSetxX; 
rectangle->base.functions.getX = rectangleGetX; 
rectangle->base.functions.setY = rectangleSetY; 
rectangle->base.functions.getY = rectangleGetY; 
rectangle->base.x = 200; 
rectangle->base.y = 200; 
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rectangle->height = 300; 
rectangle->width = 500; 
return rectangle; 


} 
下 面 说 明 这 个 结构 体 的 用 法 : 


Rectangle *rptr = getRectangLeInstance() ; 
rptr->base.functions.setX(rptr,35); 
rptr->base.functions.display(); 

printf("%d\n", rptr->base.functions.getX(rptr)); 


输出 如 下 : 
Rectangle 
35 


现在 创建 一 个 Shape 指针 的 数组 ， 然 后 像 下 面 这 样 初始 化 。 当 我 们 把 Rectangle 
赋 给 shapes[1] 时 ， 其 实 没 有 必要 非得 把 它 转 换 成 (Shape *), 但 是 不 这 么 做 会 
产生 警告 : 


Shape *shapes[3]; 

shapes[0] = getShapeInstance() ; 
shapes[0]->functions.setX(shapes[0],35); 
shapes[1] = getRectangleInstance(); 
shapes[1]->functions.setX(shapes[1],45); 
shapes[2] = getShapeInstance(); 
shapes[2]->functions.setX(shapes[2],55); 


for(int i=0; i<3; i++) { 

shapes[i]->functions.display(); 

printf("%d\n", shapes[i]->functions.getX(shapes[i])); 
} 


执行 这 段 代 码 后 会 得 到 如 下 输出 : 


Rectangle 
45 

Shape 

55 


创建 Shape 指针 的 数组 过 程 中 ， 我 们 创建 了 一 个 Rectangle 实例 并 将 其 赋 给 数组 
的 第 二 个 元 素 。 当 我 们 在 for 循环 中 打印 元 素 时 ， 它 会 用 Rectangle 的 函数 行为 
而 不 是 Shape 的 ， 这 就 是 一 种 多 态 行为 。display 函数 的 行为 取决 于 它 所 执行 的 对 和 象 。 


我 们 是 把 它 当 成 Shape 来 访问 的 ， 因 此 不 应 该 试图 用 shapes[i] 来 访问 其 宽度 和 
高 度 ， 原 因 是 这 个 元 素 可 能 引用 一 个 RectangLe， 也 可 能 不 是 。 如 果 我 们 这 么 做 ， 
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就 可 能 访问 shapes 的 其 他 内 存 ， 那 些 内 存 并 不 代表 宽度 和 高 度 信息 ， 会 导致 不 可 
预期 的 结果 。 


现在 我 们 也 可 以 再 从 Shape 中 派生 一 个 结构 体 ， 比 如 Circte， 把 它 加 入 数组 ， 而 
不 需要 大 量 修改 代码 。 我 们 也 需要 为 这 个 结构 体 创 建国 数 。 


如 果 我 们 给 基 结 构 体 Shape 增加 一 个 函数 ， 比 如 getArea， 就 可 以 为 每 一 个 类 实 
现 一 个 唯一 的 getArea 国 数 。 在 循环 中 ， 我 们 可 以 轻易 地 把 所 有 Shape 和 Shape 
派生 的 结构 体 的 面积 累加 ， 而 不 需要 先 判 断 我 们 处 理 的 是 什么 类 型 的 Shape。 如 果 
Shape 的 getArea 实现 足够 了 ， 那 么 我 们 就 不 需要 为 其 他 结构 体 增加 函数 了 。 这 样 
很 容易 维护 和 扩展 一 个 应 用 程序 。 


























8.5 “小结 

本 章 我 们 探索 了 指针 的 几 个 方面 。 首 先 讨论 了 指针 的 类 型 转换 ， 接 着 用 示例 说 明了 
如 何 用 指针 访问 内 存 和 硬件 端口 ， 还 看 了 如 何 用 指针 判断 机 器 的 字 节 序 。 

我 们 介绍 了 别名 和 restrict 关键 字 。 两 个 指针 引用 同一 个 对 象 就 会 产生 别名 。 编 
译 器 会 假设 指针 存在 别名 ， 不 过 ， 这 可 能 会 导致 生成 低 效 代码 。restrict 关键 字 
允许 编译 器 执行 更 好 的 优化 。 

我 们 看 到 了 如 何 结合 使 用 指针 和 线程 ， 了 解 了 用 指针 共享 的 数据 需要 保护 。 此 外 ， 
我 们 还 研究 了 用 函数 指针 在 线程 之 间 实现 回调 ，。 

8.4 节 研 究 了 不 透明 指针 和 多 态 行为 。 不 透明 指针 让 C 得 以 对 用 户 隐藏 数据 ， 而 应 
用 多 态 的 程序 更 容易 维护 。 
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关于 作者 和 封面 


关于 作者 


过 去 29 年 来 ，Richard Reese 先后 服务 于 工业 界 和 学 术 界 。 他 曾 在 洛克 希 德 .马丁 公 
司 做 过 10 年 的 软件 开发 支持 ， 那 时 就 开发 了 一 个 基于 C 的 网 络 应 用 程序 。 他 还 做 过 
5 年 的 外 包 讲 师 ， 为 工业 界 提 供 软件 培训 。Richard 现在 是 塔 尔 顿 州立 大 学 副教授 。 


天 于 封面 

本 书 封面 上 的 动物 叫做 第 鸦 伯劳 ， 或 者 澳洲 喜 殉 (学 名 Cracticus tibicen)， 不 要 跟 印 度 
尼 西 亚 的 笛 牙 混淆， 澳洲 喜 更 根本 不 是 乌鸦 ， 它 是 伯劳 鸟 的 亲近 ， 原 生 于 澳大利亚 和 
南 新 几内亚 。 痪 浏 喜 鹊 曾经 有 三 个 独立 的 物种 ， 但 之 后 因为 杂交 慢 慢 变 成 了 一 个 物种 。 


澳 训 喜 竟 的 头 部 和 身躯 是 黑色 的 ， 背 部 、 双 村 和 尾巴 上 有 黑白 相间 的 羽毛 。 由 于 闹 
洲 喜 静 能 发 出 多 种 复杂 的 叫 声 ， 因 而 也 被 称 为 第 鸦 伯劳 。 和 乌鸦 一 样 ， 澳 洲 喜 更 也 
是 杂食 岛 类 ， 不 过 更 喜 食 昆虫 幼虫 和 无 状 椎 动物 。 它 们 喜欢 群居 ， 一 个 群落 不 会 超 
过 24 只 ， 所 有 群落 的 成 员 一 般 只 会 对 自己 的 地 盘 进 行 防 御 性 保护 。 不 过 在 春天 ， 一 
些 繁殖 后 代 的 奴 鸟 会 保护 自己 的 巢穴 ， 可 能 俯冲 攻击 经 过 的 人 及 完 物 。 


这 种 喜 鹊 是 留 岛 ,很 容易 就 能 适应 人 类 的 环境 以 及 临近 森林 的 开阔 地 带 ， 因 此 ， 它 
不 属于 濒危 物种 。 新 西 兰 人 把 它 当做 有 害 物种 ,但 是 在 澳大利亚 ， 它 能 很 好 地 控制 
外 来 物种 甘蔗 电 晓 的 数量 。 甘 芒 昌 晓 在 最 初 引 入 痪 大 利 亚 时 没有 天 敌 ， 有 毒 分 泌 物 
又 助长 了 其 数量 猛 增 。 不 过 ， 聪 明 的 喜鹊 学 会 了 翻转 甘蔗 蟾 内 ， 戳 穿 其 腹部 ， 用 长 
唉 吃 掉 蜂 蛤 的 内 脏 ， 这 样 就 能 避 开 有 毒 的 皮肤 。 研 究 人 员 认 为 澳洲 喜 鹏 很 有 希望 成 
为 甘蔗 蟾 内 的 天 敌 ， 帮 助 控制 其 数量 。 


封面 上 的 图 片 来 自 Wood 的 Animate Creation。 
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Programming/C++ 





深入 理解 C 指 针 

深入 理解 C 指 针 和 内 存 管理 ， 提 升 编程 效率 ! 这 是 一 本 实战 型 图 
书 ， 通 过 它 ， 读 者 可 以 掌握 指针 动态 操控 内 存 的 机 制 、 对 数据 结 
构 的 增强 支持 ， 以 及 访问 硬件 等 技术 。 本 书 详细 阐述 了 如 何在 数 
组 、 字 符 串 、 结 构 体 和 函数 中 使 用 指针 ， 同 时 演示 了 相应 的 内 存 
模型 及 其 对 指针 使 用 的 影响 。 


外 针 为 C 语 言 带 来 了 强大 的 功能 和 灵活 性 ， 却 也 是 C 语 言 中 最 难 呈 
的 一 块 “ 骨 头 ”。 本 书 旨 在 帮 读 者 透彻 理解 指针 ， 解 决 这 个 老大 
难 问题 。 不 论 是 初学 者 还 是 经 验 丰 富 的 C/C++ 程 序 员 和 开发 人 员 ， 
都 能 从 本 书 受益 。 


本 书 主要 内 容 包 括 : 

上 指针 的 基本 概念 及 各 种 指针 类 型 的 声明 ， 

目 学 习 动态 内 存 分 配 、 释 放 以 及 其 他 内 存 管 理 技术 ， 
目 向 函数 传递 数据 和 从 函数 返回 数据 ; 

卓 理解 数组 和 指针 的 关系 ; 

目 如 何 通过 指针 使 用 字符 串 ， 

日 检查 缓冲 区 溢出 等 指针 安全 问题 ， 

日 理解 不 透明 指针 、 有 界 指针 、restrict 关 键 字 。 
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如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@turingbook.com， 会 有 编辑 
或 作 译 者 协助 答疑 。 也 可 访问 图 灵 社 区 ， 参 与 本 书 讨 论 。 
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